SAS 在今年的年度大會 SAS Innovate 2024 發表 Data Maker,給企業生成數據用作訓練專門的 AI 模型。為加強技術,SAS 最新收購英國合成數據公司 Haze 的核心軟件資產,讓企業客戶安全高效地產生難以大量搜集的數據。
數據是推動 AI 的重要資源,不過往往涉及私隱等因素,令企業無法取得大量真實數據去訓練 AI 模型,尤其醫療保健及金融等受到嚴格隱私規管的行業。隨著數據需求日增,業界開發合成數據技術,僅用小量數據模擬真實數據的統計模式,而又不帶有可識別資訊,產生大量同類數據去訓練。近年更由生成式 AI 幫助,準確模擬真實數據。
合成數據為企業帶來的競爭優勢:
- 運用合成數據集尋找創新機會
- 加快產品推出市場的時間
- 可信的 AI 系統
- 提升數據私隱和安全
- 降低成本
SAS 收購英國公司 Haze 的軟件資產,將會整合至 SAS Viya 平台的 Data Maker,加強方案的合成數據能力,預計 2025 年初發表初步預覽。
SAS 技術總監 Bryan Harris 引用數據分析員預測,在 2026 年前將有 75% 的企業會使用生成式 AI 來建立合成客戶數據,而 2023 年則只有不足 5%。引入合成數據讓企業客戶能夠解決數據問題,利用以往因可用性、存取限制或數據質素等而無法觸及的數據資源。