第360章 聖杯

101看書

  第360章 M語言和最先被幹掉的職業

  獅城看似是一個獨立國家,在某種程度上依然是依附於阿美利肯存在的。

  在阿美利肯的官方網站裡大致是這樣寫的:

  雙方在共同經濟利益、國防安全合作以及持久的民間關係上建立了廣泛而持久的關係。

  而在近幾年,阿美利肯實際上一直在加強和獅城的外交關係。

  其中在2021年發布了加強與獅城戰略夥伴關係的情況說明書,當年阿美利肯副總統的獅城之行反覆強調了這一點。

  而從2021年到2031年之間,雙方的關係是一直在加強的態勢中。

  李氏家族轉手把獅城賣給鄭理,這是阿美利肯方沒有想到的,等他們知道,李家已經和鄭理完成了意向談判。

  意向談完了,現在再想去阻止已經晚了。

  而且對於阿美利肯來說,跟未來可能從鄭理身上獲得的收益相比,獅城沒有那麼重要。

  因此他們對這筆交易保持冷眼旁觀的態勢。

  而且李家能跟鄭理做交易,阿美利肯就不能嗎?

  在阿美利肯真正掌權家族的操縱下,鄭理以三隻延壽十年的藥劑,獲得了阿美利肯在獅城的所有人手。

  同時廢除了之前簽訂關於租借獅城軍事基地的協議,自此阿美利肯在獅城方的利益和組織實現了全面撤退。

  本來以為背後能夠扯張虎皮也就是阿美利肯的獅城議員們,瞬間沒了脾氣。

  阿美利肯都老實撤軍了,還折騰啥呢。

  至於聯繫獅城的武裝部隊進行政變,這純屬痴心妄想。

  梅林在外界的形象壓根就不是實體,同時接管獅城的人工智慧,你武裝部隊靠什麼去幹掉人工智慧?

  再者,這是全民決定的結果,你從法理上就沒有基礎,而且根本沒有實質上的物理目標。

  再加上獅城的武裝部隊也不傻,為了政客的利益去賭自己的前途甚至生命?

  獅城的剩下的十多萬公務員,則是被鄭理分而化之。

  鄭理利用獅城的名義,新成立了數家國營企業。

  這些企業會從廣大公務人員群體裡招聘。

  老實聽話的參加選拔,不老實聽話的,你儘管去鬧,鄭理表達了不可能妥協的態度。

  同時大幅度提高失業人群待遇,按照最低保障直接發錢。

  組合拳下來,全體失業的公務人員也老實聽話了。

  大家都知道梅林不會有什麼暗箱操作,既然是選拔考試,這幫優中選優的公務人員,自然都覺得自己有機會。

  而且對於他們來說,梅林成立的國營公司,不管從待遇還是從梅林所體現出來的技術來看,前景是一片光明。

  在其中的間隙,獅城發布了一系列人工智慧框架,在其框架里這樣寫道:

  「以下公布的人工智慧框架,遵循藍星網際網路自興起以來一直流行的開源精神,將一些比藍星現有AI框架在某些方面更加優秀的AI框架公開。

  所有個體以及企業都可以免費使用這些AI框架。」

  在鄭理看來,藍星的生產力提高速度還不夠快,在人工智慧和其他產業融合的進度依然不如預期。

  在獅城的政務型人工智慧,充分展現了他在人工智慧領域的肌肉之後,他希望借公開AI框架,來進一步推進藍星的人工智慧和產業融合進度。

  這其中的過程可以由他來全部完成,也可以由他給藍星的人工智慧領域帶來一些啟發,讓他們在自己的引導下完成。

  人工智慧的進一步落地,結合生物光伏技術,藍星的就業人口將降低百分之八十,甚至更多。

  大量生產力被釋放出來,不管是去從事更加有技術含量的工作,還是說去豐富虛擬世界生態,都比現在做一些沒有意義的工作要好。

  鄭理在藍星呆的時間不算短,十多年時間裡鄭理雖然一直在社會的頂層,但是通過網際網路,他對藍星的社會生態有一定的認識。

  在他看來,藍星很多工作沒有絲毫意義,純純為了折磨人而存在的,連產出都沒有。

  製造業、服務業好歹有產出。

  即便是有產出的工作,鄭理同樣覺得沒有意義,在浩瀚宇宙中好不容易才誕生出來的智慧生命,不應該把生命花在這種枯燥的機械勞動中。

  需要讓智慧生命自己去尋找生命存在的意義。

  而不是把社會設計的重重關卡,即便跌跌撞撞的闖過了所有關卡,依然會有種人生虛度的感覺。

  對鄭理來說,獅城只是試驗田,最終要推廣到整個藍星。

  鄭理在magic.com這個域名下公開的AI框架,包括了全新的程式語言以及圍繞這個程式語言的開源包,也就是圍繞這個程式語言的工具。

  像python之所以在這幾年如此受歡迎,和python有著大量好用的工具包不無關係。

  這些封裝好的包,讓利用python語言編程的難度大幅度下降。

  梅林發布的M語言一公布,迅速引發了整個網際網路行業的地震。

  「太謙虛了,豈止是在某些方面優秀,是在所有方面都優秀。

  雖然我還沒搞懂,但是我總覺得這玩意比藍星現在的主流人工智慧框架要先進多了。」

  主要這玩意太專業了,太專業的東西跟主流群體註定是絕緣的。

  即便是專業的算法工程師,都需要一段時間的鑽研。

  網友們的議論大多停留在對於自己是否會失業的擔憂:

  「感覺梅林不是魔法師,而是程式設計師,各種想方設法的推動人工智慧的大規模落地。

  先是在獅城使用人工智慧取代人力,然後是發布開源的AI程式語言和框架。

  我嚴重懷疑魔法師使用魔法是不是就跟編程有點類似?」

  「梅林收了神通吧,我好不容易才找到工作,尼瑪不會又把我給優化了吧,我不想從微博畢業啊。

  這可是我好不容易才找到的理想工作。」

  發下面這條微博的是一個鑒黃師。

  確實存在這種職業,而且待遇還不錯。

  不過對於他來說,屬於是一語成讖了。

  這幫網際網路大廠們在梅林發布AI語言和配套的框架以及工具包之後,讓下面的算法工程師放下所有手上的活:

  「大家這段時間唯一的工作,就是把M語言以及M框架和配套的這一系列包,學會怎麼用。

  然後結合我們的工作,看有哪些地方可以利用M語言來進行重寫的。」

  其中最先被利用到的就是AI鑒黃。

  AI鑒黃一直都是內容安全的核心訴求,基本上從豬廠、鵝廠到微博、字節,全部都在研究這玩意。

  屬於經典的入門容易精通難。

  早期的鑒黃基本上是人工審核,屬於勞動密集型工種。

  後來上網人數多了,內容也多了,人工審核成本越來越高,因此採用AI+人工的方式鑒黃就成為了主流。

  AI+人工的方式一般是先通過機器過濾出大部分一定正常和一定有問題的圖像,剩下的再交給人工進行審核,這樣可以大幅度降低人力成本,而且機器識別效果越好,人工審核成本越低。

  AI鑒黃其實是比較寬泛的概念,可以是通過規則系統來實現,比如基於MD5、基於用戶的IP等信息設置黑名單庫,直接基於規則進行攔截。

  大部分還是會採用算法模型,也就是用算法模型判斷一張圖像中是否包含sq信息,本質上就是圖像識別。

  圖像識別目前在部分任務上的效果甚至超越了人類。

  圖像識別中最常見的就是圖像分類算法,從AlexNet到VGG,從ResNet到DenseNet。

  目前的圖像分類算法可以較為準確地區分ImageNet的1000類數據,鑒黃本身也是對輸入圖像做分類,因此採用圖像分類算法就是順其自然的事。

  而且目標檢測算法可以用來檢測sq圖像中的露點部位,也是比較可靠的手段。

  此外,還有基於業務層面構造的特徵和邏輯,比如是否有人、皮膚的面積等,用來輔助判斷,在一些情況下確實是有效的。

  AI鑒黃的難點主要在於不露點的軟sq,特徵小的sq、非通用sq以及卡通動漫sq等等。

  這是圖片ai鑒黃的難點,視頻和音頻鑒黃的難點就更多了。

  而且對於這幫網際網路大廠來說,即便能夠做到百分之九十九的攔截率,剩下百分之一的內容都不得了。

  以微博為例,每天產生的數據都是以T為單位。

  即便是幾十個T,百分之一的攔截失誤率,都足夠把來總整的夠嗆。

  而且更重要的是華國的內容審核行業,不僅僅局限於鑒黃,OCR審查這幫網際網路大廠更是很早就在做了。

  點到為止。

  同樣的道理,百分之九十九的攔截率,對他們來說都是無法接接受的。

  所以一直到了2031年,依然是AI加人工的鑒黃方式。

  只是說2021年的時候像微博這個體量的,可能需要上千名鑒黃師,到了2031年只需要上百名。

  四位數變三位數。

  至於微信,伱在微信發的每份圖片視頻都會OCR一遍,然後丟到後端的審查接口。

  通過權重算法來判斷你是否有違規行為,觸發特定規則之後,會決定你傾向的權重,權重超過閾值之後你會被重點關注。

  將會有人工來對你進行審核。

  當然這種審核不僅僅是國內的大廠,fb、ins、youtube、Google和推特都有大量的人工審核團隊。

  他們的審核團隊放在菲律賓。

  在2018年的時候,關於這件事,PBS放過一個紀錄片。

  對於國內外的網際網路巨頭們來說,他們在文字識別上能夠做到接近百分之百,但是在圖像分類測試中,只能做到98%左右。

  而且對算力有非常高的要求,壓根用不到實際的生產環境裡。

  這是ImageNet每年的圖像分類測試競賽結果,實際運營中的圖像視頻識別比ImageNet競賽可要難得多。

  而鄭理公開的AI算法後,利用M語言寫出來的模型。

  從部署到使用突破了這幫網際網路公司的認知,一個能夠對內容實現99.9的識別成功率的AI模型,需要花的算力和之前差不多。

  也就是說之前網際網路大廠們幾百人的AI鑒黃規模,現在再度被壓縮了百分之九十。

  AI鑒黃只是M語言最先落地的應用。

  它代表的AI技術,在算力優勢以及算法本身的落地難度都大幅度提升。

  它允許輕鬆構建大部分原本複雜的架構,能夠廣泛的應用在工業領域。

  大量易於組合的模塊化部件,編寫自己的圖層類型、計算圖抽象、數據和模型並行、動態類型的穩定性等等都完美適配。

  在算法工程師們使用之後,Github上M語言相關的項目成為社區熱門。

  國外的程式設計師社區里,活躍的大牛都在吐槽,一些很少發言的大牛也冒泡了:

  「梅林的技術遠超我們的想像,如果M語言是他自己開發的,那他在AI領域的造詣要超過我們所有人。

  真的很難見到一款沒有任何缺陷的AI程式語言。

  像Caffe能夠把Matlab的快速卷積網絡實現移植到C和C++,適用於前饋網絡和圖像處理,不需要任何代碼就可以訓練模型。

  但是caffe不能使用於循環網絡,同時擴展性極差。

  谷歌推出的TensorFlow框架能夠生成計算圖之後執行自動微分,不需要在嘗試新的神經網絡排列的時候,手動去進行編碼。

  但是它運行速度很慢,同時在大型的軟體項目里非常容易報錯。

  基本上這些年各大網際網路巨頭們推出的AI框架,或多或少都會存在問題。

  當然這是無法避免的,沒有什麼東西能夠完美。

  就像Java使用的人再多,活躍的時間再長,也是能夠找到缺點的。

  但是M語言在人工智慧領域,就好像沒有缺點一樣。

  好像經過了無數次的測試和優化,達到了一種圓滿。

  這讓我嚴重懷疑,梅林掌握的人工智慧是強人工智慧。

  他能夠實現幾乎藍星人對於人工智慧的所有幻想。

  包括自我編程。

  一段代碼能夠編譯另一段代碼,好像也不是那麼稀奇。

  畢竟現在的人工智慧模型已經可以自己進行簡單的編程了。」

  (本章完)

101看書