哈佛大学与谷歌发布100万本公共领域书籍,为AI训练提供合法数据
哈佛大学与谷歌合作,发布了一个包含100万本公共领域书籍的数据集,旨在为AI训练提供合法且多样化的文本数据。这些书籍涵盖了多种类型、语言和作者,包括许多经典作家的作品,如狄更斯、但丁和莎士比亚,这些作品因版权过期而成为公共领域的一部分。该数据集的发布将有助于AI研究,特别是自然语言处理领域,同时为AI模型提供了丰富的学习资源。然而,具体的发布方式和时间尚未公开。
哈佛大学与谷歌合作,发布了一个包含100万本公共领域书籍的数据集,旨在为AI训练提供合法且多样化的文本数据。这些书籍涵盖了多种类型、语言和作者,包括许多经典作家的作品,如狄更斯、但丁和莎士比亚,这些作品因版权过期而成为公共领域的一部分。该数据集的发布将有助于AI研究,特别是自然语言处理领域,同时为AI模型提供了丰富的学习资源。然而,具体的发布方式和时间尚未公开。