第92章 頂尖算法團隊的讚嘆(下)
一時之間伊芙·卡莉陷入了沉思。
無論這個270%是怎麼得出來的,想來應該不是無中生有。
在別的國家的軟體宣傳是什麼規矩伊芙不清楚,但是在米國如果沒有一個邏輯自洽的衡量模型作為理論支撐就貿然進行這種無中生有的量化宣傳的話,很容易被罰的底褲都不剩。
即南風APP這個所謂的「270%」大概率是建立在足夠強大並且能夠邏輯自洽的準確度衡量模型的基礎之上的。
不過也不好說,每年為了博眼球而不顧宣傳規矩的開發者比比皆是。
出於嚴謹的科研態度,伊芙·卡莉以【文本摘要準確度衡量模型】為關鍵詞進行了檢索。
在檢索結果中伊芙·卡莉一眼就看到了混雜在一眾模型之中的有一個新出現的準確度衡量模型。
沒辦法,很難注意不到,以往的十多個對文本摘要準確度進行衡量的模型,伊芙·卡莉說是如數家珍也不為過。
現在這個名為「LH文本摘要準確度衡量模型」伊芙·卡莉之前就從來沒見過。
大致看了一下這個模型採用的準確度衡量方法。
伊芙意外的發現通過這種全新的準確度衡量模型,評估人員不需要引入任何主觀因素介入到摘要準確度的評估的過程中。
正因為沒有主觀因素的介入,這個準確度評估方法完全可以對現有的全部文本摘要算法的摘要準確度進行量化分析。
這個衡量模型還演示了幾個使用範例。
在尼克雅虎新聞摘要那個軟體里的算法經該模型衡量之後,準確度分數居然只有1分。
而南風APP則獲得了3.7分的分數。
看到這個結果,伊芙明白了南風APP所謂的摘要準確度領先270%是怎麼來的了。
看來這個LH文本摘要準確度衡量模型一定也是南風APP的開發者搞定的了。
即便不是南風APP開發者搞定的,兩者之間應該也有某種聯繫。
不然這個模型的衡量結果怎麼會同南風APP的軟體宣傳的數據出現高度的同質化。
不得不說,這個名為LH的全新的衡量準確度的方式讓伊芙·卡莉有種豁然開朗的感覺。
通過利用該衡量模型,他們今後的研究也會更順暢一些。
不過讓伊芙·卡莉比較意外的是「LH文本摘要準確度衡量模型」並不是以論文的形式單獨出現的,
而是出現在一個名為「生成式文本摘要算法」的專利中。
在專利中出現的衡量模型?無疑意味著即便這個模型很高效,但在實際使用時理論上還是要得到專利所有者的授權。
這也太狗了吧?哪有把這種模型往專利里放的道理。
而且只是一個算法有必要申請專利嗎?
儘管伊芙·卡莉他們之前的算法很強大,但是他們也並沒有申請專利。
不過對此伊芙也沒什麼好說的。
他們之所以不申請算法專利不是因為他們大公無私。
而是因為他們之前的算法只是在前人的基礎上改進,並不具備完全的獨創性。
另外申請專利多多少少都會涉及到一定程度的技術公開。
雖然專利申請者可以不公布全部的細節,但即便是不公布細節,也需要把技術路線說明。
在知道技術路線的情況下,世界上頂尖的研發團隊也不是吃素的。
雖然不能按照專利里闡述的技術路線開發出一個一模一樣的算法明著侵權。
但是通過專利里公開的技術路線受到的思維啟發卻很容易讓別的相似技術彎道超車。
事實上也正因為擔心技術路線泄露的問題,這些年在米國很少出現專門的算法專利。
額,還是說這個專利所有者就是那麼自信,根本不怕別人追趕?
伊芙看到「生成式文本摘要算法」這項專利的擁有者是Lin Hui
從拼讀上看似乎是個中文名字,對於這個名字伊芙茫然無知。
不過通過谷歌搜索Lin Hui,伊芙倒是很容易搜到了一堆相關信息。
然而這些信息對伊芙來說都算不上什麼好消息。
伊芙看到Lin Hui雖然是在專利中提出的「LH文本摘要準確度衡量模型」。
但他似乎沒有將該模型私有的打算。
反而主動將這個模型呈報給美國國國家標準委員會以及國際標準化組織進行審核。
即Lin Hui非但不介意將這套評估方式公開,反而致力於將這套衡量體系作為新聞摘要行業里衡量摘要準確度的標準。
也可以理解,哪個人不渴望自己隨便做的一個框框成為全世界通用的標準呢?
現在新聞摘要行業除了LH模型之外,幾乎沒有一種完全不需要引入主觀因素的衡量準確度的模型。
在這種情況下,這個「LH文本摘要準確度衡量模型」大概率將成為文本摘要準確度衡量的唯一客觀標準。
這是什麼概念?正所謂一流團隊做標準,二流團隊做技術。
在伊芙他們團隊還在浮於技術層面進行算法研究時。
真正有雄心的開發者Lin Hui不但著手搞定了更有效率文本摘要算法。
同時還謀求對行業標準進行統一。
所以說他們一開始就落敗了麼?
儘管一向波瀾不驚,此時伊芙·卡莉也不免有些黯然。
她默默地將Lin Hui這個極其自信並且有遠見的中國人的名字記在了心中。
書友們新年快樂!祝書友們新的一年心想事成,萬事如意。
(本章完)