新浪科技讯 9月27日上午消息,百度近日正式对外宣布开放其深度学习开源平台PaddlePaddle,这也是继Google、Facebook、IBM后又一家将人工智能技术开源的公司。
PaddlePaddle的前身是百度于2013年自主研发的深度学习平台Paddle(Parallel Distributed Deep Learning,并行分布式深度学习),且一直为百度内部工程师研发使用。
PaddlePaddle在深度学习框架方面,覆盖了搜索、图像识别、语音语义识别理解、情感分析、机器翻译、用户画像推荐等多领域的业务和技术。今年9月1日百度世界大会上,百度首席科学家Andrew Ng(吴恩达)首次宣布将百度深度学习平台对外开放,命名PaddlePaddle。
目前,PaddlePaddle已实现CPU/GPU单机和分布式模式,同时支持海量数据训练、数百台机器并行运算,以应对大规模的数据训练。此外,PaddlePaddle具备高质量GPU代码,提供了Neural Machine Translation、推荐、图像分类、情感分析、Semantic Role Labelling等5个Task,每个Task都可迅速上手,且大部分任务可直接套用。
PaddlePaddle研发负责人徐伟百度资深科学家、PaddlePaddle研发负责人徐伟介绍:“在PaddlePaddle的帮助下,深度学习模型的设计如同编写伪代码一样容易,设计师只需模型的高层结构,而无需担心任何琐碎的底层问题。未来,程序员可以快速应用深度学习模型来解决医疗、金融等实际问题,让人工智能发挥出最大作用。”
目前,PaddlePaddle已在百度30多项主要产品和服务之中发挥着作用,如外卖的预估出餐时间、预判网盘故障时间点、精准推荐用户所需信息、海量图像识别分类、字符识别(OCR)、病毒和垃圾信息检测、机器翻译和自动驾驶等领域。以外卖行业为例,外卖员等待商家出餐的时间耗时严重,百度将不同时段商家的客流量、菜品的制作时间和订单量等数据交给了PaddlePaddle,经过对海量数据的深度学习处理,如今,百度外卖的内部系统可以预估每个商家菜品出餐时间,及时告知外卖员,提高了送餐效率,系统也可以更加合理地规划取餐和送餐的路线。
早在今年1月份,百度便将可让人工智能软件运行更高效的关键代码Warp-CTC开源。该代码可直接用在当前的人工智能框架中,不仅比传统CTC训练速度快百倍,还大幅降低了对硬件的要求,缩短了研发的周期,让端到端的深度学习变得简单、快速。
据百度方面透露,9月底百度还将发布PaddlePaddle的新版本,将全面支持Mac操作系统、以及Cuda8.0和GCC5.4的支持,同时进一步优化了安装过程,帮助更多开放者更好地“上手”。
公开资料显示,谷歌于去年11月发布并开源了新的机器学习平台TensorFlow,供相关技术人员进行语音识别或照片识别等多项机器深度学习领域的研究;IBM几乎同步采取了行动,于去年11月底宣布通过Apache软件基金会免费为外部程序员提供System ML人工智能工具的源代码;社交巨头Facebook,继去年1月公开多款深度学习人工智能工具后,又于去年12月开源了Big Sur人工智能硬件架构。(李根)