百度大腦:百度大腦概述,發展歷程,百度大腦核心AI技術,1、深度學習,2、語音技術

百度大腦是百度 AI 核心技術引擎，包括視覺、語音、自然語言處理、知識圖譜、深度學習等AI核心技術和AI開放平台。百度大腦賦能百度內部各業務，並通過百度智慧型雲賦能行業客戶。

2019年4月20日，“百度大腦核心技術及開放平台”榮獲2018年度中國電子學會科學技術獎科技進步獎一等獎。

基本介紹

中文名：百度大腦
外文名：Baidu Brain
發布時間：2016年9月1日
官網：ai.baidu.com
願景：成為AI時代全球最具影響力的技術平台
使命：引領科技發展，用科技讓複雜的世界更簡單

百度大腦概述,發展歷程,百度大腦核心AI技術,1、深度學習,2、語音技術,3、視覺技術,4、自然語言處理,5、知識圖譜,百度大腦AI技術成果,百度大腦AI開放平台,百度大腦落地及套用案例,1、第一產業,2、第二產業,3、第三產業,

百度大腦概述

百度大腦是百度技術多年積累和業務實踐的集大成，包括視覺、語音、自然語言處理、知識圖譜、深度學習等 AI 核心技術和 AI 開放平台，對內支持百度所有業務，對外全方位開放，助力合作夥伴和開發者，加速 AI 技術落地套用，賦能各行各業轉型升級。

2016年百度世界大會，百度大腦1.0完成基礎能力搭建和核心技術初步開放；2017年百度AI開發者大會，百度大腦2.0形成了完整的技術體系，開放60多項AI能力；2018年百度AI開發者大會，百度大腦3.0核心技術突破為“多模態深度語義理解”，同時開放110多項核心AI技術能力。

截止目前，百度大腦已對外開放了150+項領先的AI能力，構建起AI全棧技術布局。未來百度將繼續平等賦能開發者，讓每一位開發者都能平等便捷地獲取AI能力。

發展歷程

以搜尋業務為核心

2000年1月，百度作為一家搜尋引擎公司誕生在中關村。搜尋引擎的背後，除了有連結分析等網際網路技術，還需要自然語言處理、信息檢索等AI技術，因此，百度從誕生之初，就開始了人工智慧技術研發與套用。

全面布局AI基礎技術

2010年初，已經有了10年技術積累的百度，開始全面布局人工智慧，陸續開始了包括自然語言處理、機器翻譯、語音、圖像、知識圖譜、機器學習、數據挖掘、用戶理解等技術的研發。

2012年1月，百度開始研發深度學習技術，並於當年上線語音識別和圖像識別能力，大幅提升了識別效果。正是由於看到了深度學習在套用中的驚艷效果，百度在2013年初成立了世界上第一個深度學習研究院。

2013年下半年，百度在世界上首次將深度學習技術套用於大規模搜尋排序系統。2015年，百度上線了世界上首個大規模神經網路機器翻譯系統，比Google早了一年多時間。

對外開放AI核心能力

2016年9月的百度世界大會上，基於百度16年的深厚積累，百度大腦正式發布，同時宣布對外開放百度AI核心技術。

2017年7月百度AI開發者大會上，百度大腦2.0正式公布包含基礎層、感知層、認知層和平台層在內的完整技術布局，並通過AI開放平台對外開放包含語音、圖像、視頻、增強現實、自然語音處理等在內的90餘項AI核心能力，積極與行業合作夥伴和廣大開發者一起共建AI技術生態。

2018年7月百度AI開發者大會，百度大腦宣布升級至3.0，開放110多項核心AI能力，並公布百度大腦每日的調用次數已超過4000億次。百度大腦3.0的核心技術突破是“多模態深度語義理解”，不僅讓機器聽清、看清，更可深入理解其背後的含義，從而更好地支撐各種套用。

百度大腦核心AI技術

1、深度學習

深度學習是人工智慧（AI）最熱門的研究領域之一，已經成為引領人工智慧持續突破的關鍵技術。

技術研發方面，12年，百度開始研發深度學習技術，並於當年上線語音識別和圖像識別能力。2013年，百度成立深度學習研究院。2017年，由中華人民共和國國家發展和改革委員會批覆，百度牽頭籌建了國內唯一的深度學習技術及套用國家工程實驗室，百度以“領頭雁”身姿引領中國深度學習核心技術研發。

能力開放方面，2016年，百度正式宣布對外開放PaddlePaddle，它是國內最早開源、也是當前唯一一個自主研發功能完備的深度學習平台。依託百度業務場景的長期錘鍊，PaddlePaddle具備了最全面的官方支持的工業級套用模型，支持稠密參數和稀疏參數場景的超大規模深度學習並行訓練，擁有強大的多端部署能力。18年PaddlePaddle 3.0版本正式發布，升級為全面的深度學習開發套件，除了核心框架，還開放了VisualDL、PARL、AutoDL、EasyDL、AI Studio等一整套的深度學習工具組件和服務平台，更好地滿足不同層次的深度學習開發者的開發需求，具備強大支持工業級套用的能力。

2、語音技術

百度語音技術基於業界領先的聲學模型和語音模型，可將聲音與文字信息進行相互轉換，可用於智慧型導航、語音輸入、語音搜尋、智慧型客服、文字有聲閱讀等場景。主要包括語音識別、語音合成、語音喚醒三大能力。

3、視覺技術

百度圖像技術是基於深度學習算法，輸出多種核心人工智慧視覺技術，包括圖像識別、人臉與人體識別、視頻技術、AR與VR等AI能力和多場景的行業解決方案。百度大腦圖像處理技術可智慧型識別圖像類別、內容和含義，支持基於圖像識別的場景套用。百度視頻技術，輸出視頻內容分析、封面選區、對比檢索、內容審核等能力。AR技術上，百度AR Dumix平台為開發者提供了涵蓋AR套用開發、內容生產、內容管理和內容分發的一站式解決方案。

4、自然語言處理

百度自然語言處理技術輸出如情感傾向分析、評論觀點抽取等語言處理基礎技術、智慧型寫作、文本審核、機器翻譯等核心AI能力與多場景行業解決方案。該技術的目的，就是讓計算機能夠處理和生成人類語言，從而讓機器具備人類的思考和理解能力。

5、知識圖譜

百度知識圖譜是全球最大規模中文知識圖譜，包含6億實體、3780億事實，面向開放域多形態數據的知識挖掘技術及高性能圖檢索和計算框架，突破了傳統知識獲取規模小、成本高、效率低的瓶頸，實現了千億級知識的實時查詢和計算。在知識圖譜規模、圖譜數據容量及檢索性能等指標上均達國際領先水平。知識圖譜大規模套用於百度搜尋、信息流、百度地圖和對話式人工智慧作業系統，覆蓋超過85%的搜尋請求，日均用戶請求超過13億次。

百度大腦AI技術成果

2018年2月，美國權威雜誌《麻省理工科技評論》(MIT Technology Review)揭曉了2018年“全球十大突破性技術”（10 Breakthrough Technologies 2018），在官方榜單中，百度被列為實時語音翻譯領域“關鍵玩家”，成為本年度唯一一家入選的中國公司，也是史上首個連續三年入選該榜單的中國公司。

2018年2月，百度自然語言處理（NLP）團隊研發的V-Net模型以46.15的Rouge-L得分登上微軟的MS MARCO（Microsoft MAchine Reading COmprehension）機器閱讀理解測試排行榜首。百度NLP在MARCO提交的V-NET模型，使用了一種新的多候選文檔聯合建模表示方法，通過注意力機制使不同文檔產生的答案之間能夠產生交換信息，互相印證，從而更好的預測答案。此外，此次百度只憑藉單模型（single model）就拿到了第一名，並沒有提交更容易拿高分的多模型集成（ensemble）結果。

2018年3月，百度憑藉全新的人臉檢測深度學習算法PyramidBox，在世界最權威的人臉檢測公開評測集WIDER FACE的“Easy”、“Medium”和“Hard”三項評測子集中均榮膺榜首，刷新業內最好成績，超過了國內外眾多科技公司和高校實驗室，這也是繼2015年提出DenseBox算法之後百度再次刷新人臉檢測紀錄。

2018年4月，以“大數據+”為主題的第十三屆中國電子信息技術年會在蘇州召開，百度知識圖譜榮獲2017中國電子學會科技進步一等獎。

2018年6月，百度視覺技術團隊憑藉領先的圖像識別和視頻理解技術在全球兩大視覺競賽WebVision和ActivityNet中分別擊敗100多家參賽單位和隊伍，獲得多項世界第一，並受邀在全球視覺技術領域頂級學術會議CVPR（IEEE國際計算機視覺與模式識別會議）上做報告分享。

2018年9月，百度視覺團隊在最大規模目標檢測競賽Google AI Open Images-Object Detection Track中再獲佳績，擊敗了全球450多支參賽隊伍，脫穎而出獲得世界第一，並受邀在頂級視覺學術會議ECCV2018上做分享。

2018年11月，人工智慧頂級峰會 NIPS八大挑戰賽之一AI for prosthetics Challenge（人工智慧假肢挑戰賽）已經決出勝負，百度擊敗來自全球 400 個技術團隊奪得冠軍，其 9980 分的高分，足足領先第二名高達 30 分之多。據媒體報導，此次挑戰賽是通過強化學習算法，來實現對人類骨骼仿真模型的訓練，使模型能最大限度模仿人類運動方式，從而實現人工智慧與生物科技的真正結合。

NeurIPS是人工智慧和機器學習領域的國際頂級會議，百度數篇學術論文入選 NeurIPS 2018。百度大數據實驗室於當地時間2018年12月2日組織了一場主題為《Common Model Infrastructure》的 Workshop，邀請了來自谷歌、微軟、XPrize 的研究者，就自動機器學習這一專題進行分享，百度方面也介紹了自己在這方面的研究成果。

AAAI是人工智慧領域的國際頂級會議，早期由計算機科學和人工智慧創始人Allen Newell, Marvin Minsky和John McCarthy等人首創，被中國計算機學會(CCF)推薦為A類會議。百度共有15篇論文被人工智慧頂級學術會議AAAI 2019收錄，多位百度科學家、研究者受邀將赴會作報告。

2019年2月，第十三屆國際語義評測比賽（International Workshop on Semantic Evaluation, SemEval 2019）論壇評論建議挖掘任務評測（Task 9A: Suggestion Mining from Online Reviews and Forums）中，百度一舉擊敗來自全球的210餘支隊伍，最終以F值78.12%的成績奪得冠軍，再次印證了百度在語義理解等核心技術的世界領先地位

百度大腦AI開放平台

百度AI開放平台持續升級，是目前最完整、最前沿、最開放、最具活力的AI技術平台。現階段從深度學習框架、深度學習實訓平台、場景化AI能力、定製化訓練平台，到軟硬一體模組和解決方案等實現全面開放，為各行各業賦能，加速創新AI產品落地，助力企業智慧型化轉型。

百度 AI 開放平台上的開發者數量超過100萬，加入燎原計畫的合作夥伴超過300家，入選百度AI加速器企業覆蓋金融、工業、農業、零售、醫療、網際網路等17大行業。

百度大腦落地及套用案例

百度大腦持續不斷地開放，讓越來越多行業和企業變得越來越智慧型，藉助AI提升效率，創造新價值。目前，百度AI能力已被廣泛套用於醫療、零售、金融和安防等不同領域，讓任何人在任何地方，都能通過百度平等獲取頂尖的AI能力。

1、第一產業

農業遙感無人機

遼寧盤錦的農民張玉軍，通過使用百度與麥飛科技合作的農業遙感智慧型監測系統，引入邊緣計算，對農作物病蟲害實施智慧型化監測，並完成精準施藥，能夠將農藥使用量降低50%。百度正利用AI能力讓農業生產提質增效，“打好中國糧，端好中國碗。”

利用PaddlePaddle搭建智慧型桃子分揀機

北京工業大學的 4 位學生利用百度 PaddlePaddle 開源平台上的深度學習模型，用這些大桃照片，通過機器學習和模型訓練，製造了一台智慧型桃子分揀機，從形狀、大小、色澤、光潔度等多維度，對桃子自動分級，從而實現自動分揀。該團隊將 6400 張大桃照片按照紅、大、中、小等元素按照分檔建立圖片數據集合，將圖片數據集放入卷積神經網路（CNN）中進行訓練，自動提取用於分級的影響要素並形成分類邏輯。實現對大桃的自動分列、判斷、分裝，準確率達到 90% 以上。

2、第二產業

無人自主挖掘機

百度與鐵甲合作推出的無人自主挖掘機，是世界上首台基於視覺技術構成的低成本、可以量產的解決方案工程裝備。採用百度的無人自主挖掘機，能夠將施工效率提升15%，人力成本降低40%，實現收入提升50%以上。製造業的AI化不僅可以解放人力，還可以激活產業，推動智慧型製造的發展。

智慧型零件分揀機

質檢是絕大多數製造企業的必備部門。但現在，大多數零件製造企業的質檢，還只能靠高密度的人工檢測。PaddlePaddle與領邦智慧型深度合作打造了領邦智慧型零件分揀機，實現零件的自動分揀，基於官方支持的ICNET模型，分揀精度可達到99%以上，預測速度較同類產品快20%。此外，分揀機還在通用性上有很好的表現，目前機器可支持幾十種形狀的高精密小零件的分揀。

3、第三產業

AI眼底篩查一體機

基於百度大腦的AI眼底篩查一體機在2018百度世界大會上正式亮相。目前，AI眼底篩查一體機已在廣東肇慶等多個地區落地，可以幫助患者快速的篩查包括糖網、青光眼、老黃等多種眼底疾病，提早預防致盲風險，該系統經過權威測試，篩查準確率已經相當於10年以上的眼科醫生。大會現場，李彥宏宣布百度將與衛計委合作，在834個國家級貧困縣中的500個貧困縣的醫院，部署搭載AI眼底篩查系統的一體機，幫助基層的眼病患者儘早的發現致盲的風險，及時就醫。

援藏醫生利用深度學習進行顯微鏡下寄生蟲蟲卵識別

陳靜飛，援藏醫生（4年，西藏農牧學院），去西藏前是臨床方面的醫生（主要集中在微生物感染疾病上）。援藏醫生陳靜飛在西藏地區9地調研後發現，藏區牧民、牲畜寄生蟲感染率比內地明顯嚴重。原因不僅在於西藏人少地廣、牧區面積大，人畜接觸多，同時也因為西藏地區基層醫療單位缺乏技術過硬的檢驗人員，感染率居高不下，且醫生不知道病人感染的是什麼寄生蟲，也不知道該用什麼藥。

零AI基礎的援藏醫生陳靜飛藉助百度EasyDL進行顯微鏡下寄生蟲蟲卵識別，輔助檢驗人員進行寄生蟲蟲卵的相關診斷，有效改善人工識別的諸多不足。現在這套系統已經可以識別10多種寄生蟲蟲卵，在小範圍的臨床檢驗試點裡，識別測試準確率穩定在97%以上，未來幾個月，可以實現識別常見的40多種寄生蟲蟲卵，並不斷提高識別準確率和識別速度。換句話講，這個系統只用了幾個月時間，識別能力可以相當於一位有20多年臨床經驗的檢驗專家，比一般檢驗醫師識別寄生蟲的種類要多很多，同時準確率和識別速度更好。

陳靜飛表示，希望藉助EasyDL輔助西藏基層醫生診斷寄生蟲，解決基層一線醫療單位寄生蟲蟲卵識別能力不足的問題，改善西藏地區寄生蟲危害。

美國零售商Checkpoint超市購物車監控

美國零售安防提供商Checkpoint基於百度AI技術能力，通過與普通攝像頭結合，打造智慧型抓拍機，用於監視超市購物車下層是否有未付款商品，並精準排除殘疾人購物車及兒童購物車。這種方案成本高、效率低，已在美國紐約州、新澤西州、賓夕法尼亞州等七個州的160個超市中，總計約1600台攝像頭設備上落地。目前，該模型的準確率達到95%以上，遠超此前靠感測器判斷的準確率。

百度大腦