來源:網絡 | 2021-12-23 11:07:34
你會相信人工智能是經過人工合成數據訓練的,而不是真實世界的數據嗎?你可能不知道,但你可能已經知道了——根據最新公布的調查結果,這沒關系。
用于測試和培訓人工智能應用程序的高質量、特定領域的數據集的匱乏,使得團隊爭先恐后地尋找替代方案。大多數內部方法要求團隊收集、編譯和注釋他們自己的DIY數據——進一步加劇了偏見、邊緣案例性能不足(即泛化能力差)和隱私侵權的可能性。
然而,一個可取之處似乎已經在眼前:合成數據的進步。這種計算機生成的真實數據本質上為團隊目前面臨的任務關鍵型問題列表上的幾乎每一項提供了解決方案。
這就是《合成數據:2022年生產就緒人工智能的關鍵》簡介的要點這項調查的結果是基于計算機視覺行業工作人員的回答。然而,調查結果具有更廣泛的意義。首先,因為有廣泛的市場依賴于計算機視覺,包括擴展現實、機器人、智能車輛和制造業。第二,因為為人工智能應用生成合成數據的方法可以推廣到計算機視覺之外。