更多

    中大教授研究可解釋 AI 開發自動改圖技術 SeFa

    Eric Chong
    Eric Chong
    商業・科技・創業・編輯

    業界近年發展機械學習、深度學習,但卻因無法解釋模型的推論決定而備受質疑。研究可解釋 AI 是技術突破的方向。中大訊息工程學系助理教授周博磊從研究可解釋 AI ,開發出自動改圖編輯器 SeFa ,更可控制當中的參數,輕易產生大量圖像。

    SeFa 採用生成對抗網絡( Generative Adversarial Networks,GAN )以非監督方式,由兩個深度學習模式分別負責產生影像和評價,不斷反覆修改而成最終圖像。他指出,只要給數千張同類物件的圖片給訓練模型, SeFa 便通過 GAN 產生相關影像,而且可控制結果,例如大小、顏色、角度、形狀等, 1 秒內產生圖像,過程不需人手標籤。

    以貓為例,經過訓練後的 SeFa ,只提供一張貓相,便能隨意修改影像,改變拍攝角度、姿勢等。再以汽車示範,甚至從正面變成背面,生成的影像幾可亂真。

    周博磊解釋, SeFa 以可控制 AI 的技術,識別出 GAN 模型的潛在語義,成為圖片編輯的調整參數,自動生成需要的影像。

    SeFa 的 AI 改圖技術,可改變貓的位置。
    SeFa 的 AI 改圖技術,可改變貓的位置。

    亦可改變汽車的方向,甚至展示背面。
    亦可改變汽車的方向,甚至展示背面。

    用於產生漫畫,可改變人物造形。
    用於產生漫畫,可改變人物造形。

    他在中國上海交通大學取得生物醫學工程學位,前去香港中文大學攻讀資訊工程研究士,之後赴麻省理工獲博士學位,專注研究可解釋 AI 技術。亦因這研究成果,令人工智能模型變得更透明,獲選入 MIT Technology Review 2020 的 35 歲以下亞太區科技創新者。他表示, SeFa 是研究成果所伸延的技術之一。

    該演算法的論文已在《 arXiv 》上發表,並將會免費公開。此技術可用於創作漫畫、平面設計、電影,更可給自動駕駛汽車作模擬訓練。周博磊稱,在虛擬訓練自動駕駛的模型,未必有足夠的真實影像數據提供,通過 SeFa 生成,能短時間內產生大量不同的路面影像。他透露,該技術目前還未在商業領域上使用,不過跟大陸幾間互聯網公司示範過,正在洽談進一步合作。

    相關文章

    您會感興趣的內容

    相關文章