來源:網絡 | 2021-12-23 11:15:30
1) 語言人工智能將占據中心舞臺,NLP獲得的資金將超過其他任何人工智能類別。
語言是人類最重要的發明。與其他任何屬性相比,它是我們物種智力的決定性標志。
自然,語言滲透到每個行業的每個商業活動的方方面面。因此,準確地自動化語言的能力為價值創造提供了幾乎無限的機會。
自然語言處理(NLP)領域在過去幾年中被稱為transformers的基礎性新技術顛覆和推動,該技術首次由谷歌研究人員在2017年的一篇論文中引入。我們現在才達到這樣一個地步:這項功能強大的技術已經足夠成熟,可以大規模生產和商業化。語言人工智能的革命,以及商業的革命,即將到來。
2) DataRicks、DataRobot和Scale AI都將上市。
這三家公司是現代人工智能經濟的第一批大贏家。它們各自提供工具和基礎設施來幫助其他公司構建人工智能,反映了基礎設施先于應用程序的跨技術周期的共同主題。
3) 至少有三家氣候AI初創公司將成為獨角獸。
氣候技術已迅速成為全球最熱門的初創企業類別之一,今年有創紀錄數量的風險資本涌入該行業。正如本專欄之前所探討的,在氣候和人工智能的交叉點上,創業公司的機會比比皆是。
一些氣候人工智能初創公司最近以大量融資的形式出現(盡管迄今為止商業吸引力有限)。明年,其中一些參與者將乘著氣候技術狂熱的東風,估值超過10億美元。最有可能的獨角獸候選人將是為新碳經濟構建工具的公司(例如,企業碳會計、碳補償基礎設施)。
4) 強大的新人工智能工具將用于視頻。
視頻已經成為我們數字生活的主要媒介。據思科稱,2022年超過80%的互聯網數據將是視頻。每天有70億視頻在YouTube上觀看,1億視頻上傳到TikTok。從Netflix到Amazon Prime Video,再到Disney+,再到Hulu,再到HBO Max,甚至更遠,互聯網流媒體服務的用戶群和內容庫都在不斷膨脹。
5) 將建立一個超過10萬億個參數的NLP模型。
如今,自然語言處理(NLP)領域的定義是越來越大的基于轉換器的模型的發展。這場軍備競賽將在2022年繼續進行(盡管DeepMind最近在小型模型的力量方面進行了有趣的工作)。
7) 多個大型云/數據平臺將宣布新的合成數據計劃。
獲取正確的數據是當今構建人工智能產品最重要和最具挑戰性的部分。與收集和標記現實世界數據集的現狀方法相比,合成數據具有令人信服的優勢。Gartner預測,到2024年,合成數據將占AI開發中使用的所有數據的60%。Facebook收購合成數據初創公司AI。
8) 多倫多將成為硅谷和中國以外世界上最重要的人工智能中心。
可以毫不夸張地說,現代人工智能是在多倫多發明的,這要歸功于杰夫·辛頓(Geoff Hinton)等深度學習先驅的工作。盡管多倫多的人氣不如其他地區,但它仍然是世界上最重要的人工智能中心之一。
這里到處都是人工智能人才。根據CBRE最近的一份報告,多倫多滑鐵盧大都會區是“北美最大的科技人才市場(僅次于灣區)”,也是“增長最快的市場”。由Hinton在多倫多共同創建的向量研究所是世界上最大的人工智能研究機構之一。從谷歌到微軟再到IBM,世界上最大的科技公司近年來都在這座城市建立了重要的分支機構。
9) “負責任的人工智能”將開始從一個模糊的總括術語轉變為一套可操作的企業實踐。
人工智能技術的發展速度快于我們負責任、道德和公平地部署它的能力。
由Timnit Gebru、Joy Buolamwini和Cathy O'Neill等研究人員領導的倡導負責任地使用人工智能的運動正在興起。推動更負責任的人工智能涉及一系列廣泛的問題,包括人工智能偏差、數據來源、模型可解釋性和模型可審計性。
雖然人們對這些問題的認識在不斷提高,但這個主題仍然十分抽象,總體而言,人工智能從業者不會將“負責任的人工智能”實踐構建到他們的日常工作流程中。
10) 強化學習將成為一種越來越重要和有影響力的人工智能范式。
當今人工智能的主要方法是監督學習,這需要收集大量數據,對其進行標記,并將其輸入人工智能模型,以便人工智能學習有關世界的有用模式。無監督學習是一種類似的方法,但不需要人工生成標簽,近年來也開始受到重視。
但人工智能中還有另一種范式,已經存在了幾十年,但其巨大的現實世界潛力才剛剛開始顯現:強化學習。