首頁▷ 現代都市▷ 《穿越：2014》▷ 第107章谷歌產生濃厚興趣(下)

◈上一章：第106章谷歌產生濃厚興趣(中)

下一章：第108章來自國內的關注 ◈

第107章谷歌產生濃厚興趣(下)

第107章谷歌產生濃厚興趣(下)

然而作為具體的執行人員，對於谷歌提出的任務：

——評估LIN HUI提出的算法實現的可行性，並根據實際情況考慮能否短時間實現復現

伊芙·卡莉就很無語。

或許在那些屁股決定腦袋的人心中。

清楚技術路線了，技術復現能夠實現與否只是時間長短的問題了。

但事實哪有那麼簡單。

反正進行了一晚上嘗試的伊芙·卡莉發現想要進行復現很難。

拋開LINHUI提出的算法技術本身不談。

就是LIN HUI在生成式摘要算法專利中順手牽羊搞定的那個「LH文本摘要準確度衡量模型」

其他團隊想要從無到有的構建一個同樣的模型都有億點困難。

說起來LH文本摘要準確度衡量模型的構建過程思路倒是很清晰：

第一，運用語言模型來評估算法生成語言的流暢度；

第二，使用相似度模型評估文本和摘要之間的語義相關性；

第三，為了有效評估實體、專有詞的復現程度，引入原文信息量模型來評估。

……

然鵝也僅僅是說起來很簡單而已。

說到把大象放進冰箱也很簡單同樣是三步：

——打開冰箱門，放進大象，關上冰箱門。

知道怎麼做沒用，關鍵還是要執行。

沒辦法執行的話，步驟再清晰也沒用。

LH文本摘要準確度衡量模型的構建過程有三步。

第一步就很複雜。

該怎麼進行語言模型的構建呢？

按照LIN HUI提出的技術路線。

語言模型建模過程中，包括詞典、語料、模型選擇等。

問題出在語料庫上，語料庫一詞在語言學上意指大量的文本。

這類文本通常經過整理，具有既定格式與標記。

涉及到英文語料庫的信息還比較容易，畢竟伊芙所在的團隊和牛津、哈佛、耶魯三所大學的語言學方面都是深度合作的關係。

但涉及到中文以及其他文字預料信息該怎麼處理這就完全不好說了。

巧婦難為無米之炊。

沒有語料庫清楚技術路線什麼的也沒用。

倒是可以姑且先拋棄對中文以及其他新聞生成式摘要的研究。

但是這樣幾乎等同於放棄了一個龐大的市場。

而且最關鍵的是LIN HUI提出的算法本身就能兼顧中文新聞摘要以及英文新聞摘要。

那麼之後LIN HUI會不會直接開發個中文新聞處理成英文摘要的功能呢？

能搞定文本摘要處理算法的人沒道理一個翻譯算法都搞不定吧？？

伊芙·卡莉越想越覺得這種可能性很大。

不然為什麼一個摘要軟體要做成類似於翻譯軟體那樣的交互風格呢？

在她們還在躊躇不前的時候。

對手卻早已經大步向前挺進了。

一時之間伊芙不禁有種酣戰過後的無力感。

這就是所謂的一步落後步步落後吧。

這種情況還評估啥？

直接建議谷歌方面把LIN HUI的算法買回來就好了！

雖然LIN HUI是華國人.

但這種技術又不是什麼涉及到國家命脈的重要技術。

總不至於不賣吧！

不賣的話謀求專利授權也可以啊！

總不至於非跟在別人身後造輪子吧。

伊芙又沒受/虐/欲。

(本章完)

分享給朋友：

◈上一章：第106章谷歌產生濃厚興趣(中)

下一章：第108章來自國內的關注 ◈

© 2020 ttkan.net | SITEMAP | DMCA | PRIVACY | support@ttkan.net