2019年7月30日
人工智能(AI)愈趨普及,針對金融科技的應用更比比皆是。安聯投資(Allianz Global Investors)早前在港舉辦亞洲首個程式設計馬拉松,由香儂科技(Shannon.AI)以新聞分析脫穎而出,透過文本字句檢測謠言特徵,以識別指定公司的投資風險。
程式設計馬拉松9隊競逐
安聯投資邀請全球9間初創組隊來港競賽,隊伍須在48小時內就3個範疇,包括「銷售」、「投資」及「風險管理」等案例,運用AI技術提出解決方案。評判團就每個案例,選出一隊優勝隊伍,其方案將獲得採用。
來自北京的香儂科技,在「投資」案例組別獲勝。香儂科技數據科學家孟昱先指出,隊伍需要根據案例,找出影響公司債券孳息(Yield)的新聞或評論,他說:「我們需要從大會提供的債券孳息數據,以及對應時間段內所有關於指定公司的新聞中,提取可以訓練模型的數據,並讓模型學習這些新聞的特徵,用作未來預測。」
香儂科技算法工程師孫曉飛解釋,團隊在人工智能(AI)及自然語言處理(NLP)上,尤其機器學習及演算法均有深厚經驗,公司名字識別準確率非常高,有助「清洗」案例的「噪音」數據,避免墮入標籤含糊的陷阱,「以『力高集團』為例,文章出現『力高』二字,除了指該集團,也可能只是用了成語『法力高強』。」
孫曉飛又指出,香儂有不少已訓練好的模型產品,只需稍為調整,就可快速應用到新任務上,「如風險分類模型,它能夠在新聞之中,識別指定公司存在的投資風險,如債券、收益問題,以至公司高層的負面新聞等,共有40多種分類;這些正負面的分類,在比賽期間給予我們不少提示。」
機器學習比對事實揭造假
近年網絡充斥大量假新聞,能否有效篩選正確的資料,乃機器學習需要克服的難題。孟昱先提到,從機器學習角度而言,有不少能鑑別謠言的特徵,如網站和文章作者的權威性等,「我們會從已有的文本中抽取字句,並進行事實檢測。如文章中談及的所謂事實,與知識庫中的既定事實存在矛盾,便可簡單地檢測到文章的造假部分。」
孟昱先續稱,真假檢測是一個非常廣泛的領域,如有消息指某公司最近業績欠佳,其實當下難以判斷,只能繼續觀望;加上不同平台的謠言亦有不同風格,香儂更關心經濟學數據的事實檢測。
採訪、撰文:陳施敏
訂戶登入
下一篇: | 南美初創籲勿誇大AI功能 |
上一篇: | 坐言起行 保育地球 |