- +1
AI社會學|眾包時代:你掙到你的一美元了嗎?
每個學期課至中途,通常是美國高校春季假期的前一周,我都會給學生布置一個回家作業。作業很簡單,既不要求你寫三千字論文,也不需要處理五萬條數據,而是要你以工人(worker)身份登錄全球最大的眾包平臺——亞馬遜旗下的Amazon Mechanical Turk (MTurk),然后,賺上一美元。
每年學生回來匯報的經歷五花八門,無奇不有,很多人在經歷了九九八十一難之后仍舊沒有拿到那一塊錢。常常是激情吐槽了半堂課后,才有人總結陳詞:這一塊錢也實在太難賺了!
學生們在平臺上遇到的第一個困難,是身份審批。跟美國大多數涉及雇傭人工的打工平臺一樣,亞馬遜有著繁瑣的審批過程。出于稅務的考慮,平臺往往要求工人提供具體身份信息,包括社會安全號碼。
審批之后,第二個困難會接踵而至,就是在平臺上找到標價一美元的工作。學生的反饋是,很多工作有非常繁瑣的“打工要求”,譬如,你必須身處美國,必須完成過多少份工作,必須有百分之九十以上的成功率。更甚者,一頁一頁往下滾屏的時候,看到的多是標價五毛錢的問卷調查,標價一毛錢的數據清洗工作,甚至標價一分錢的圖片標注工作—— 譬如,請動手圈出下列圖片里含有紅綠燈的那些,或者,請手工將下面這張手寫的收據抄錄成電子版。有學生抱怨說,有些標價一塊錢的工作一出來就被搶光了。一些五毛錢的“高薪”工作,會要求你先完成一個長達三頁的教程,然后參與一個長達兩頁的測試,最后才能看到工作頁面。也就是在你打上工之前,先要打一份預備工,目的是看看你到底有沒有資格打這份工?!
最后,工打完了,還存在工資結算的問題。學生回憶道,工資并不是當場結算的,很多雇主會明確說明,工作里含有“測試類型”的問題(譬如,請選擇含有選項b的那一欄),如果沒有正確回答上這些問題,說明打工不認真,完成的工作會被“雇主”斷然拒絕。一般情況來說,這拒絕是單方面的,打工人并沒有上訴討薪的機會。
還有些學生匯報,在打過一次工之后,他發現自己在平臺上出現了數據評分——你可以看到自己成功地完成過幾次工作,成功率是多少,但并無關于具體工作的具體評價。學生們說,他們感覺,很多時候,雇主是靠這些抽象的數據在篩選工人。
低薪,內卷,乏味,有時甚至討薪無門,歡迎來到AI背后的眾包時代。
眾包(crowdsourcing)一詞,始于2000年代早期,指的是將無數微小工作通過網絡靈活機動地分派給大量用戶的一種勞動組織形式。2004年,《紐約客》的名記詹姆斯·索諾維爾基(James Surowiecki)在《群體的智慧》(The Wisdom of Crowds)里開篇立意:如何正確地估算一頭公牛的重量呢?如果讓一位畜牧業專家和一群什么也不懂的鄉民對決,哪一邊的估重更準確?
索諾維爾基的中心思想是,群體的智慧也許遠優于單個專家的決策。在公牛的例子里,組織一群鄉民,讓每一個單獨給出公牛的估重,經過平均后得到的數值,最后往往比最資深的畜牧業專家的估重更為準確。
這之后,“群體的智慧”成為年度熱門詞匯。從某種程度上來說,很多我們耳熟能詳的在線社區都是這一概念直接或者間接的獲益者,譬如依賴大量網絡用戶自愿參與編輯的維基百科。2008年,在美國聯邦交通管理局授權和資助下,鹽湖城甚至進行了一項通過公眾參與大眾交通規劃的眾包項目,當地居民可以經由網絡運用群體的智慧重新設計城市交通規劃。
2005年11月,亞馬遜上線了Amazon Mechanical Turk (MTurk),將眾包的想法正式平臺化和商業化,之后不同類型的眾包平臺如雨后春筍,紛紛涌現。Turk這個名字最初來自于18世紀一架號稱在歐洲巡回演出里打敗了拿破侖的超級國際象棋機器。之后人們發現Turk其實完全不是全自動的現代化機器,而是一架木偶,木偶底下藏著一個人類的象棋高手。所以,與其說是機器在與人類對弈,不如說是人類操縱機器在與人類對弈。
亞馬遜繼承了這個概念,將其眾包平臺命名為Turk,不可不說是有一點黑色幽默的意思在里面。之后,科研人員和初創人工智能公司們大批涌入MTurk,作為“雇主”(“requester”)登陸平臺,發布所謂的“人工智能工作” (“Human Intelligence Tasks”, 也被簡稱為HIT)。通常情況下,這些工作是計算機算法在當前的科技發展下尚且無力處理,人類卻可以通過簡單訓練很快就能上手的工作,譬如圖像識別、內容審核、語音識別等等。
很多時候,這些由數以萬計的世界各地的勞工們一份一份手動處理的數據,組成了當代人工智能算法的基石。譬如,我們之前討論過的人工智能歷史上最大的計算機視覺數據集ImageNet,其龐大的1500萬張各式各樣的圖片,就是由眾包平臺上近五萬名工人共同標注的。而之后無數先進的計算機視覺算法,都是在這個數據集上訓練出來的。
從這個角度上來說,亞馬遜大佬杰夫·貝索斯(Jeff Bezos)將MTurk平臺提供的服務稱為“人工的人工智能”(artificial artificial intelligence),也許是更為貼切的說法。
最早以“群體智慧”的希望興起,在被平臺們商品化和算法化之后,眾包的概念飽受批評。
最顯著的批評,是對于勞動的剝削。
第一層的剝削來自平臺。據統計,MTurk每日上線超過60萬項任務, 平臺以20%~45%的比例對這些任務進行提成。其中將近四分之一的任務標價在一分錢左右,超過70%的任務標價在五分錢左右。 由于工人是美國法律意義上的“獨立承包商”,因此他們不受美國大部分勞工法律的保護,也不受最低工資法的保護。
第二層的剝削來自雇主。對于企業,尤其是各種AI初創企業來說,眾包平臺轉嫁了他們需要尋找、培訓、雇傭工人帶來的成本。眾包平臺說,我們的工人們是“按需”存在的、“流動”的,以及“靈活”的。然而同一套說辭對于打工人來說,就意味著他們的工作就是“全天待命”的,“沒有保障”的,以及“呼之即來,揮之即去”的。
首先,平臺上的工人需要花時間篩選工作,如我們之前討論的那樣,報酬高于一美元的工作少之又少,很多工作有不同的門檻要求。而這一部分“尋找和篩選”工作的時間往往并不會計入工作時長,收到報酬。
其次,“按需”的工作常常意味著工人必須時刻在線,隨時準備工作。與通常的理解相反,“按需”是指雇主只有在需要的時候才發布工作,而不是工人只有在需要工作的時候才去工作。對工人來說,算法分配的優質工作往往在瞬間就被一搶而光,長時間在線甚至“全天待命”是硬性要求。
最后,“靈活”就業的意思是,工人沒有社保,沒有工位、辦公設備、上崗培訓,甚至也沒有要求雇主進一步解釋工作的機會。平臺上的工人需要自己配備工作設備,搞清楚工作的要求是怎樣的,產出到底是怎樣衡量的,否則就有可能拿不到最后的工資。
更深一層里,是在文化層面上對于勞動的異化和分層。
加州大學圣地亞哥分校的傳播學者莉莉·伊拉尼(Lilly Irani)說,眾包平臺們的興起,從本質上,是將數以萬計的有關人工智能的勞動進行了分層:一批獨角獸和天才程序員們上升成為人工智能科學的皇冠;另一批則下沉成為了現代人工智能產業的不可見的底層設施。人工智能算法不可及之處,隨時有大量廉價動態的人類勞動可以補上。但付出勞動的工人們只是計算機系統里的一串符碼(譬如A98DR9ETTTNNSS),他們不但沒有名字,沒有同事,甚至對自己的勞動也沒有自主權,對工作的目的和性質更是一無所知。福特時代為汽車擰螺絲的工人們尚且知道他們最終的產品是一輛汽車,眾包工人接收的卻只是一項被打散成不能再打散的工作,譬如,標注這張照片上河流的位置。至于標注后的圖片是被用去訓練汽車還是坦克,工人們沒有知情權,也沒有署名權。如此,身處于發達國家的資本家,獨角獸和天才程序員們永遠可以出現在最光鮮亮麗的酒會,鼓吹優異的員工福利,扁平化的公司管理,去等級化的工作環境;而不用去理會今天發布的最新版自動駕駛汽車是用印度南部單親媽媽們手動標注的數據訓練出來的。
一張圖片一分錢。
2008年,《連線》雜志的記者杰夫·豪(Jeff Howe)在 《眾包:大眾力量緣何推動商業未來》(Crowdsourcing: How the power of the crowd is driving the future of business)一書里說, “MTurk允許客戶們將我們希望計算機能做、但(事實上)卻不能做的各種瑣碎工作外包”。而那些工作,大部分是“枯燥、無腦、低薪的任務 ”(“dull, brainless, low-paid tasks”)。
國際勞工組織(International Labor Organization) 在2018年發布了對生活在全球75個國家、在五個英語眾包平臺上工作的3500名工人的大規模調查。他們的數據顯示:
● 在2017年,一個眾包工人的每小時平均收入為3.31美元。
● 56%的工人從事眾包工作超過一年;29%的人從事眾包工作超過三年。
● 眾包工人受過良好的教育:37%的人有學士學位,20%的人有研究生學位。
● 平均來說,工人每做一小時的有償工作,就會花20分鐘進行無償工作,無償工作包括尋找任務,參加無償的資格測試,以及寫評論。
● 對于大約32%的工人來說,眾包工作是他們的主要收入來源。
● 眾包平臺上最常見的任務包括回應調查和參與實驗(65%),訪問網站內容(46%),數據收集(35%)和轉錄(32%)。
● 眾包工人里各種社會保護的覆蓋率很低:2017年,10個受訪者中只有6個有健康保險,只有35%的人有養老金或退休計劃。
2006年,亞馬遜大佬貝索斯對一群聚集在麻省理工學院的科技精英們介紹彼時剛剛上線的眾包平臺MTurk,將其與新興的“云計算”(cloud computing)相比較。他說,與“云計算”一樣,MTurk提供了即時的、按需提供的、可通過計算機代碼訪問的計算力(computational power)。不同的是,在MTurk上,計算力是人。
“你們都聽過 “軟件即服務”;今天上線的是“人類即服務” (“You’ve heard of software-as-a-service. Well this is human-as-a-service”)。
我們這里沒有工人,更無所謂階級,我們提供的,只是“服務”。
當然,更大的問題是:為什么會有那么多受過高等教育的人愿意隨時待命,去做這一批低薪,內卷,沒有福利,沒有職業前景,還常常討薪無門的眾包工作?是什么驅使著他們將自己掛在平臺上等待被“雇傭”?
2013年,莉莉·伊拉尼和她的合作者推出了Turkopticon。作為第三方網站和瀏覽器插件,Turkopticon允許Mturk上的“工人”(worker)聯合起來,對發布任務的“雇主” (requester)進行反向評分。
有人說,它是眾包時代里工人們所擁有的最接近“工會”的東西。也有人說,它是眾包時代的“階級斗爭工具”。
最新的眾包任務,發生在俄烏之戰的前線。據推特網友Bogdan Kulynych的實時報道,他在一家名為Premise的眾包平臺上發現了要求眾包工人在烏克蘭為俄羅斯軍隊的導彈算法拍攝、標注、識別關鍵地理位置的工作。根據工作時長和辛苦程度,其報酬從0.25美元到3.25美元不等。
隨后Premise暫停了平臺在烏克蘭的運營,并辟謠道,它在烏克蘭的工作是“代表西方民主國家,希望了解該國的基礎設施狀況”。而據《華爾街日報》報道,Premise是通過眾包方式,為世界各地政府安全部門收集信息的諸多眾包平臺之一。其大金主主要來自于美國國家安全部門。
參考文獻:
1. Irani, Lilly. "The cultural work of microwork." New media & society 17.5 (2015): 720-739.
2. Surowiecki, James. The Wisdom of Crowds. Anchor, 2005.
3. Tau, Byron, “Premise Mobile-Phone App Suspends Ukraine Activities After Accusations Fly.” Feb 26, 2022, The Wall Street Journal, https://www.wsj.com/livecoverage/russia-ukraine-latest-news-2022-02-26/card/premise-mobile-phone-app-suspends-ukraine-activities-after-accusations-fly-8FDnhZe9raunaIJ4HV66
4. Gray, Mary L., and Siddharth Suri. Ghost work: How to stop Silicon Valley from building a new global underclass. Eamon Dolan Books, 2019.
5. Berg, J., Furrer, M., Harmon, E., Rani, U., & Silberman, M. S. (2018). Digital labour platforms and the future of work. Towards Decent Work in the Online World. Rapport de l’OIT.
6. Irani, L. C., & Silberman, M. S. (2013, April). Turkopticon: Interrupting worker invisibility in amazon mechanical turk. In Proceedings of the SIGCHI conference on human factors in computing systems (pp. 611-620).
7. Howe, Jeff. Crowdsourcing: How the power of the crowd is driving the future of business. Random House, 2008.
-----
作者沈虹,畢業于美國伊利諾伊大學香檳分校傳播學系,現任職于美國卡內基梅隆大學。她用社會學的方法研究新興科技。
- 報料熱線: 021-962866
- 報料郵箱: news@thepaper.cn
互聯網新聞信息服務許可證:31120170006
增值電信業務經營許可證:滬B2-2017116
? 2014-2025 上海東方報業有限公司