百度人工智能的数据来源

    在数据方面,除了海量的优质数据,百度拥有大量自建的高质量数据,包括百度阿拉丁(优质资源开放平台)、百度知道、百度百科、知识图谱等,不仅可以支持结构化数据的文章的生成,还可以支持基于内容聚合方式的文章生成。百度阿拉丁的时效性结构化数据,如体育比赛、彩票、股票信息、恶劣天气预警等,是速报类文章生成的数据基础。百度百科、百度知道和知识图谱是知识类文章生成的重要数据来源。

    以百度百科的城市百科为例,城市百科中包含了大部分城市的景点、美食、文化排行榜等数据,这些数据与对应景点、美食的描述数据相结合就可以生成城市旅游、美食、文化的介绍文字。同时,基于海量的用户行为日志数据,可以准确地捕捉对这些内容感兴趣的用户,就可以实现生成内容的个性化推荐和满足。

你可能感兴趣的:(机器学习)