經過外國勢力干擾選舉,和個人資料濫用事件公開後, Facebook 以很多措施來防止濫用或散布不實信息等。最近他們又公布引入新系統,以人工智能抽出圖片和影片裡的文字,並加以分析,以便在第一時間將不恰當的貼文拉下來!
這個名為 Rosetta 的系統是分成兩個程序來抽出圖片和影片中的文字的,首先它從圖像中檢測出可能含有文字的長方形區域,然後在該區域裡辨識當中的語意。可能你會認為一般 OCR 軟件都可以判別文字,不過據 Facebook 解釋, OCR 軟件只認知道文字字母,但就不認識字義和圖片的關連。而 Facebook 現在就用上區域卷積神經網絡來進行這個工作。
現在 Rosetta 每日從 Facebook 和 Instagram 中超過 10 億張圖片和動畫中實時抽出文字,然後輸入到文字辨識模組裡進行文字和圖像文理的分析。這個系統更利害的是它不單可以辨識英文字,還可以辨識從右向左讀的阿拉伯文。這不單對在熱門動態裡顯示高關連性內容有幫助,還可以協助及早發現嵌在圖片裡帶有侮辱性、搧動性或虛假信息的字句。