精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

美國(guó)七巨頭,OpenAI、Claude、xAI后訓(xùn)練都找他要專家,時(shí)薪高達(dá)500刀!史上增長(zhǎng)最快公司CEO:大模型處于評(píng)測(cè)時(shí)代

原創(chuàng) 精選
人工智能
近日,一家名為 Mercor 的公司出圈了,他創(chuàng)造了史上增長(zhǎng)最快的速度!從 100 萬美元到 5 億美元營(yíng)收僅用了 17 個(gè)月!更厲害的是,他們從未有過客戶流失,凈收入留存率超過?1600%,年?duì)I收已經(jīng)穩(wěn)定在九位數(shù)的水平。

從 100 萬美元到 5 億美元營(yíng)收僅用了 17 個(gè)月!

更厲害的是,他們從未有過客戶流失,凈收入留存率超過 1600%,年?duì)I收已經(jīng)穩(wěn)定在九位數(shù)的水平。

而這家公司的CEO兼聯(lián)合創(chuàng)始人,Brendan Foody,更是美國(guó)的新一代的傳奇人物。在 22 歲時(shí),他也成為史上最年輕的美國(guó)獨(dú)角獸創(chuàng)始人。

如果你沒聽過這家公司,不打緊,但你要是知道下面這個(gè)信息,相信你肯定會(huì)感興趣:

Mercor 與“七巨頭”中的 6 家,以及所有前五大 AI 實(shí)驗(yàn)室(OpenAI、Anthropic、xAI等)合作,幫助他們招聘專家來創(chuàng)建評(píng)測(cè)與訓(xùn)練數(shù)據(jù),從而提升模型能力。

沒錯(cuò),這些頂尖的美國(guó)AI巨頭,全部都從這家公司來招聘頂尖的后訓(xùn)練專家!

近日,Brendan 做客了 Lenny 的播客訪談,更是透露出大洋彼岸的AI最新進(jìn)展。

在這場(chǎng)對(duì)話中,Brendan 解釋了為什么 evals(評(píng)測(cè))已經(jīng)成為 AI 進(jìn)展的關(guān)鍵瓶頸,他是如何發(fā)現(xiàn)這一巨大機(jī)會(huì)的,以及在 AI 驅(qū)動(dòng)的經(jīng)濟(jì)中未來的工作可能會(huì)是什么樣子。

在求職招聘方面,Brendan 特別提到:一定要關(guān)注有“需求彈性”的工作,即當(dāng)生產(chǎn)力提高時(shí),需求也會(huì)隨之大幅增加的工作,比如:軟件/設(shè)計(jì)/用戶研究。

所以,從事coding的老鐵們可以放心了,但需要注意的是:現(xiàn)在必須要使用AI來 VibeCoding 了。

此外,對(duì)于如此高增速的公司而言,作為CEO也提到了“996”高強(qiáng)度的工作。 不過最重要的是,can-do的價(jià)值觀。“行動(dòng)比想法重要!”

大模型已經(jīng)進(jìn)入Evals時(shí)代,未來3年,ASI(超級(jí)智能)為時(shí)尚早!這是他對(duì)美國(guó)硅谷各家頂尖大模型實(shí)驗(yàn)室的洞察。

“實(shí)現(xiàn)這一切的關(guān)鍵不在于‘再多10倍的預(yù)訓(xùn)練數(shù)據(jù)’,而在于更高效、更精心設(shè)計(jì)的后訓(xùn)練數(shù)據(jù)集。”

以下是整理的對(duì)話全文,原汁原味,各位自行收藏細(xì)讀,enjoy:

主持人:今天的嘉賓是 Mercor 的 CEO 和聯(lián)合創(chuàng)始人 Brendan Foodie。Mercor 是歷史上增長(zhǎng)最快的公司,從零到 5 億美元營(yíng)收只用了 17 個(gè)月,不到一年半。Brendan 也是史上最年輕的獨(dú)角獸創(chuàng)始人。他們剛剛完成了一筆 1 億美元融資,公司估值達(dá)到 20 億美元。如果你還沒聽說過 Mercor,它的業(yè)務(wù)是幫助 AI 實(shí)驗(yàn)室和 AI 公司招聘專家,用 AI 協(xié)助訓(xùn)練他們的模型。他們從未有過客戶流失,凈收入留存率超過 1600%,年?duì)I收已經(jīng)穩(wěn)定在九位數(shù)的水平。

在今天的對(duì)話中,我們會(huì)聊到 evals(評(píng)測(cè))的價(jià)值和重要性正在快速上升,像 Mercor 這樣的 AI 訓(xùn)練公司在整個(gè)版圖中的位置,以及它們?yōu)槭裁慈绱酥匾陀袃r(jià)值。我們會(huì)談到 Brendan 是如何發(fā)現(xiàn)這個(gè)機(jī)會(huì)的,他對(duì)產(chǎn)品市場(chǎng)契合的洞見,他在組織內(nèi)部建立的核心原則如何幫助他打造了史上增長(zhǎng)最快的公司。我們還會(huì)討論:為實(shí)驗(yàn)室撰寫 evals 的人每天到底在做什么;在 AI 崛起的浪潮里,哪些技能和崗位能存續(xù)得更久;他為什么認(rèn)為我們短期內(nèi)不會(huì)看到 AGI 或超級(jí)智能;以及更多話題。這期節(jié)目非常精彩,你一定要聽。

主持人:Brendan,非常感謝你今天能來。歡迎來到節(jié)目。

Brendan Foody:非常感謝邀請(qǐng)我,Lenny。我是你的超級(jí)粉絲,很期待這次對(duì)話。

主持人:我也很期待,能和你聊聊真是太棒了。我本人也是你的粉絲,希望有更多人了解你和你正在做的事情。

大模型進(jìn)入evals時(shí)代

主持人:我想從你置頂在推特上的一條推文開始。內(nèi)容是:我們現(xiàn)在已經(jīng)與“七巨頭”中的六家合作,和所有前五大 AI 實(shí)驗(yàn)室合作,以及大多數(shù) AI 應(yīng)用層公司。

主持人:有一個(gè)趨勢(shì)在所有客戶身上都很普遍:我們正進(jìn)入 evals 時(shí)代。這讓我特別注意,因?yàn)檫@是這個(gè)播客里反復(fù)被提到的主題。大家都在談 evals 的價(jià)值,以及做好 evals 的重要性。但很多人其實(shí)還不太清楚我們?cè)谡f什么,為什么這件事如此關(guān)鍵。你覺得人們還缺失了什么?他們需要知道哪些東西?evals 時(shí)代意味著什么?

Brendan Foody:如果說模型就是產(chǎn)品,那么 evals 就是產(chǎn)品需求文檔(PRD)。研究人員的日常工作就是跑幾十個(gè)實(shí)驗(yàn),在 eval 數(shù)據(jù)集上做一些小的改進(jìn)。

強(qiáng)化學(xué)習(xí)正在變得非常有效。一旦有了 eval,就能幫助模型“攀升”。比如你看奧賽數(shù)學(xué)(Olympiad math),一旦大家集中攻克,很快就飽和了;Sweebench 也是一樣。所以某種意義上,把代理(agents)應(yīng)用到整個(gè)經(jīng)濟(jì)、自動(dòng)化所有工作流的真正瓶頸是:我們?nèi)绾魏饬砍晒Γ咳绾螌?nbsp;eval,如何寫代理要做的一切事情的 PRD?而 Mercor 顯然在這里扮演著核心角色。

如何做好evals?大家更關(guān)心實(shí)際能力

主持人:聽到這,很多人可能會(huì)覺得,“好吧,我得認(rèn)真關(guān)注 eval 了。”你有什么建議嗎?比如怎么學(xué)會(huì)做好這件事?那些做得好的公司和其他公司有什么不同?

Brendan Foody:我覺得對(duì)企業(yè)來說,核心思路是:如何建立一個(gè)測(cè)試體系,系統(tǒng)化地衡量 AI 在自動(dòng)化其核心價(jià)值鏈上的效果?比如一家建筑事務(wù)所,最終交付給客戶的是建筑設(shè)計(jì)圖,那他們?cè)趺从行Ш饬?nbsp;AI 在這方面的表現(xiàn)?每家公司都有自己獨(dú)特的價(jià)值鏈,如果是多產(chǎn)品公司可能有幾條。思考如何衡量這些價(jià)值鏈,是企業(yè)有效應(yīng)用 AI 的前提。

主持人:我看到你在 No Priority 播客上和 Sarah、Elad 聊過這個(gè)話題。Sarah 還發(fā)推說“evals = 你的新營(yíng)銷”。這是什么意思?你怎么看?

Brendan Foody:是的,這和我剛才說的有聯(lián)系。如果模型是產(chǎn)品,那么 evals 既是 PRD,也是銷售資料。evals 不僅告訴研究人員應(yīng)該構(gòu)建什么,還能向外展示能力的效果。過去大家都引用學(xué)術(shù)評(píng)測(cè),比如 GPQA、humanities last exam、奧賽數(shù)學(xué)。但現(xiàn)在,大家更關(guān)心實(shí)際能力,比如模型能否自動(dòng)化搭建軟件平臺(tái),能否自動(dòng)化投行分析。我認(rèn)為無論是實(shí)驗(yàn)室還是應(yīng)用層公司,都將越來越依賴 evals 來展示他們的模型和產(chǎn)品能力。

幫大模型公司招聘專家,狂賺4億刀,為什么?

主持人:好,那我們放大一點(diǎn),聊聊你所在市場(chǎng)的格局。我在準(zhǔn)備時(shí)注意到,歷史上增長(zhǎng)最快的公司大概分三類:一類是基礎(chǔ)模型公司;一類是 vibe coding 應(yīng)用(比如 Cursor、Lovable、Bolt、Replit 等 V0 公司);第三類就是數(shù)據(jù)標(biāo)注公司,比如你們。之前我邀請(qǐng)過 Handshake 的 CEO,接下來會(huì)有 Scale 的 CEO,還有 Surge,再加上你們。能幫我們理清一下這整個(gè)版圖嗎?很多人其實(shí)并不清楚。

Brendan Foody:好的。我先講一點(diǎn)起源故事,來解釋這個(gè)格局。我們創(chuàng)始團(tuán)隊(duì)在 14 歲時(shí)就認(rèn)識(shí)了,19 歲時(shí)一起創(chuàng)辦公司。最初是在 2023 年 1 月,做國(guó)際招聘,把人匹配給朋友,并自動(dòng)化整個(gè)招聘流程——就像人類會(huì)篩簡(jiǎn)歷、面試、決定錄用一樣,我們用大模型自動(dòng)化了這些環(huán)節(jié)。靠自籌資金做到百萬美元營(yíng)收跑速后,我們才退學(xué)創(chuàng)業(yè)。后來一系列事情發(fā)生了,我們遇到了 OpenAI。

當(dāng)時(shí),人類數(shù)據(jù)市場(chǎng)正經(jīng)歷巨大轉(zhuǎn)變:早期 LLM 需要的是寫一些語法勉強(qiáng)正確句子的低中技能人群。但現(xiàn)在,需求轉(zhuǎn)向了“尋找并驗(yàn)證最優(yōu)秀的專業(yè)人士”,比如資深軟件工程師、投行人士、醫(yī)生、律師,他們能幫助評(píng)估和解讀模型能力。這時(shí)我們就開始和頂級(jí) AI 實(shí)驗(yàn)室合作,在 16 個(gè)月內(nèi)把公司從零做到 4 億美元營(yíng)收跑速。

Brendan Foody:這段旅程非常不可思議,也令人振奮。

主持人:天啊,這太瘋狂了。我不確定大家是否意識(shí)到——我想這是你第一次公開這個(gè)數(shù)字。到我們播出的時(shí)候,你們可能已經(jīng)宣布了:16 個(gè)月從 0 到 4 億美元營(yíng)收。

Brendan Foody:沒錯(cuò)。這是歷史上最快的增長(zhǎng)記錄,我們對(duì)此非常自豪。

主持人:好吧,說明確實(shí)有大事在發(fā)生。這為什么這么有價(jià)值?到底發(fā)生了什么?

主持人:讓我來簡(jiǎn)單總結(jié)一下你們的業(yè)務(wù):你們幫實(shí)驗(yàn)室招聘人來訓(xùn)練模型,不只是一般勞動(dòng)力,而是有專業(yè)背景、能解決模型知識(shí)缺口的專家,對(duì)嗎?

Brendan Foody:完全正確。這也回到你最初的問題:evals 時(shí)代。實(shí)驗(yàn)室提升模型能力的最大瓶頸就是:如何有效衡量成功?eval 既是他們對(duì)照進(jìn)展的測(cè)試集,也是 RL 環(huán)境里的驗(yàn)證者,用來獎(jiǎng)勵(lì)模型、提升能力等等。而這種需求存在于所有領(lǐng)域,所有模型還不擅長(zhǎng)的能力上。全球最有錢的公司愿意不惜代價(jià)來提升模型能力,而 Mercor 就在這個(gè)核心瓶頸上。

專家的日常工作揭秘:給大模型定紅線,監(jiān)督微調(diào)數(shù)據(jù)、強(qiáng)化學(xué)習(xí)任務(wù)

主持人:那么這些專家實(shí)際在做什么?能舉個(gè)例子嗎?比如他們一天到底在電腦前干嘛?

Brendan Foody:市場(chǎng)的邊界就是:凡是人類能做而模型還不能做的,就是需求所在。具體點(diǎn)說,如果你有一個(gè)模型,要像律師一樣修改合同條款(紅線),但它出錯(cuò)很多,漏掉關(guān)鍵點(diǎn)。你可以請(qǐng)律師像教授設(shè)計(jì)評(píng)分標(biāo)準(zhǔn)一樣,寫一個(gè) rubric(評(píng)分準(zhǔn)則),定義模型該做到哪些點(diǎn),并給出打分方式。這樣我們就能衡量模型進(jìn)步:是否達(dá)到了專業(yè)人士的標(biāo)準(zhǔn)。然后,這些 rubric 還能作為訓(xùn)練數(shù)據(jù),用來獎(jiǎng)勵(lì)模型、強(qiáng)化其能力。

主持人:所以他們本質(zhì)上就是在寫 eval,對(duì)嗎?

Brendan Foody:沒錯(cuò)。其實(shí)大家常提 RL 環(huán)境和 evals,但正如 Andrej Karpathy 說過的,它們本質(zhì)上只是不同的語義描述,本質(zhì)上都是“如何衡量好壞”。evals 既能當(dāng)作基準(zhǔn),也能當(dāng)作“銷售資料”,告訴別人“我們的模型為什么最好”,同時(shí)還能用于訓(xùn)練后階段,獎(jiǎng)勵(lì)模型實(shí)現(xiàn)某些能力。

主持人:好,那回到剛才的律師例子。

主持人:律師會(huì)寫出:什么樣的合同修改才算優(yōu)秀,并設(shè)計(jì)一個(gè) rubric 來定義“優(yōu)秀”。

主持人:那么,他們會(huì)不會(huì)還提供實(shí)際的合同修改示例?

Mercor:可能吧。所以從歷史上看,數(shù)據(jù)格局主要包含兩類數(shù)據(jù)。第一類是監(jiān)督微調(diào)數(shù)據(jù),就是輸入輸出。當(dāng)人們想到傳統(tǒng)意義上的微調(diào)時(shí),說的就是這個(gè)。第二類是強(qiáng)化學(xué)習(xí)(RL)任務(wù),模型會(huì)生成幾個(gè)示例,我們選擇哪個(gè)是最優(yōu)的。現(xiàn)在大家普遍轉(zhuǎn)向的是來自AI反饋的強(qiáng)化學(xué)習(xí)(RLAIF),而不是人類反饋。在這種方式下,人類定義某種成功標(biāo)準(zhǔn)、某種可衡量的方式。比如在代碼場(chǎng)景里,可能是一個(gè)單元測(cè)試——我們能大規(guī)模衡量成功。在其他領(lǐng)域,可能是一個(gè)評(píng)分標(biāo)準(zhǔn)(rubric)。然后你用這個(gè)來激勵(lì)模型能力的提升。這種方式更具可擴(kuò)展性,也更高效。所以,這就是為什么整個(gè)市場(chǎng)的大趨勢(shì)正朝著RLAIF發(fā)展,不僅是評(píng)估模型,也是提升模型能力。

主持人:我之前采訪過Anthropic的一位聯(lián)合創(chuàng)始人,他說的完全一樣。他們?cè)贏nthropic所做的,就是轉(zhuǎn)向AI驅(qū)動(dòng)的強(qiáng)化學(xué)習(xí)。那我試著用外行人的角度幫觀眾理解:比如,一個(gè)律師會(huì)說,紅線合同的正確修改應(yīng)該長(zhǎng)什么樣。然后AI就像自己琢磨一樣,“好,我要嘗試改進(jìn)它”,并根據(jù)給定的評(píng)估標(biāo)準(zhǔn)/評(píng)分表來判斷自己是不是在正確的方向上。

Brendan Foody:沒錯(cuò)。這就像是應(yīng)用“好結(jié)果”的所有標(biāo)準(zhǔn),類似于助教根據(jù)教授的標(biāo)準(zhǔn)來判定學(xué)生的回答是否符合某一條或幾條標(biāo)準(zhǔn),然后給多少分。

3年內(nèi)不會(huì)出現(xiàn)超級(jí)智能,因?yàn)榇竽P偷倪吔缇驮谀?/h3>

主持人:太棒了。那我們轉(zhuǎn)向更大的勞動(dòng)市場(chǎng)話題。這問題分兩部分:第一部分是,我們需要做這種事情(AI評(píng)估與訓(xùn)練)多久?會(huì)不會(huì)有一天不再需要人類?你們的公司增長(zhǎng)這么快,那會(huì)不會(huì)有個(gè)時(shí)點(diǎn)說:人類不再需要了,或者已經(jīng)飽和了?我們先聊這個(gè),再進(jìn)入更大的問題。

Brendan Foody:關(guān)鍵問題是:在經(jīng)濟(jì)中會(huì)有多久存在那些AI做不到但人類能做的事情?

Brendan Foody:當(dāng)然,有些人認(rèn)為三年內(nèi)會(huì)出現(xiàn)超級(jí)智能,那時(shí)人類將不再在經(jīng)濟(jì)中扮演任何角色——這是一個(gè)觀點(diǎn)。但我們的看法完全不同。我們的觀點(diǎn)是,這些模型非常厲害,正在快速自動(dòng)化很多事情,但也有很多它們完全不行的。比如,它仍然不能幫我在日歷上安排會(huì)議,不能幫我寫郵件,不能用一些最基本的工具。我們需要對(duì)一切做評(píng)估——對(duì)工具使用的評(píng)估、對(duì)長(zhǎng)周期推理的評(píng)估。想象一下10年后,我們希望模型能出去運(yùn)行一家創(chuàng)業(yè)公司30天,那就需要對(duì)其進(jìn)行評(píng)估來有效激勵(lì)它。而且只要在經(jīng)濟(jì)中還存在人類能做但模型做不到的事情,這條改進(jìn)之路就會(huì)一直持續(xù),這也會(huì)成為未來工作的重要組成部分。所以我們的使命就是創(chuàng)造未來的工作形態(tài)。我認(rèn)為這個(gè)行業(yè)非常令人興奮,因?yàn)樗鼮槲覀冋故玖宋磥戆l(fā)展的大方向。

未來求職:關(guān)注有需求彈性的崗位,軟件、設(shè)計(jì)、用戶研究這些崗位只會(huì)增加

主持人:我想問你轉(zhuǎn)發(fā)過的一條推文。“如果你仔細(xì)想想,我們來到這個(gè)世界的意義就是為實(shí)驗(yàn)室創(chuàng)造強(qiáng)化學(xué)習(xí)訓(xùn)練數(shù)據(jù)。”你怎么看?這句話意味著什么?是不是說我們其實(shí)就是在幫模型訓(xùn)練?

Brendan Foody:這句話對(duì)應(yīng)了我和很多頂尖實(shí)驗(yàn)室研究人員和高管的對(duì)話。他們認(rèn)為整個(gè)經(jīng)濟(jì)高度可能會(huì)演變成一個(gè)RL環(huán)境機(jī)器。我們會(huì)構(gòu)建各種各樣的世界和場(chǎng)景,然后在其中加入評(píng)分標(biāo)準(zhǔn)或其他驗(yàn)證機(jī)制。這其實(shí)非常令人興奮。類比到歷史上的其他革命,比如工業(yè)革命時(shí),大家都擔(dān)心失業(yè),但隨之出現(xiàn)了一整類新工作:如何造機(jī)器、如何進(jìn)行知識(shí)工作、如何創(chuàng)造新的事物。過去三年的AI敘事幾乎全是關(guān)于“工作被取代”。當(dāng)然,ChatGPT發(fā)展很快,大家都喜歡用它。但從經(jīng)濟(jì)層面上,討論的更多是取代,很少有公司和人去討論新工作類別正在被創(chuàng)造,以及這意味著什么,人們?nèi)绾螠?zhǔn)備和提升自己。對(duì)我來說,最令人興奮的就是:創(chuàng)造那個(gè)未來——人類如何融入經(jīng)濟(jì),并且這一過程如何演變。

主持人:我經(jīng)常遇到有人問我:我該學(xué)什么?我該提升哪些能力?正在讀書的人也會(huì)問:未來到底什么才是有價(jià)值的?而你正處在人才需求的中心,你最清楚哪些崗位最受歡迎,招聘如何演變。我想直接問你:未來哪些崗位會(huì)保留?年輕人應(yīng)該投資哪些技能?

Brendan Foody:關(guān)于崗位,我會(huì)從需求彈性很大的類別來回答。這些會(huì)非常令人興奮。比如,當(dāng)一個(gè)人生產(chǎn)力提高10倍時(shí),我們就能開發(fā)10倍、甚至100倍的軟件。產(chǎn)品經(jīng)理在這種情況下就會(huì)非常有優(yōu)勢(shì)。至于技能,我認(rèn)為關(guān)鍵是能利用AI完成自己日常工作的人。比如,我和一些老師聊過,他們想知道如何更好地評(píng)估學(xué)生。我們最早做過大量AI面試和評(píng)估,對(duì)此很有經(jīng)驗(yàn)。我們的結(jié)論是:你不應(yīng)該阻止學(xué)生用模型,就像計(jì)算器出現(xiàn)后,你不可能還讓學(xué)生天天做算術(shù)作業(yè)。你應(yīng)該告訴他們:“去用這些工具,讓我們看看你能做到什么。”所以在我們的面試?yán)铮覀儠?huì)說:“去用ChatGPT、Codex、ClaudeCode、Cursor等任何工具,在一個(gè)小時(shí)內(nèi)搭建一個(gè)網(wǎng)站。”我們想看看最終你能產(chǎn)出什么產(chǎn)品。這個(gè)例子其實(shí)就說明了技能方向:關(guān)鍵不是對(duì)抗AI,而是如何借助它在自己所在行業(yè)做得更多。

主持人:你說的“需求彈性”,是指通才型人才嗎?

Brendan Foody:不是,我指的是行業(yè)的需求容量。舉幾個(gè)例子:會(huì)計(jì)——全世界需要的會(huì)計(jì)數(shù)量是有限的,不太可能需要100倍的會(huì)計(jì)。但軟件開發(fā)不一樣。我們完全可以交付100倍的功能,迭代速度快100倍,構(gòu)建更多新東西。這里的需求幾乎無限。最近Marc(注:指硅谷投資人Marc Andreessen)也在推特上說過:軟件是最具彈性的行業(yè)。當(dāng)生產(chǎn)力提高時(shí),需求也會(huì)隨之大幅增加。這種特征在很多其他行業(yè)也存在。所以我會(huì)建議人們關(guān)注那些:當(dāng)大家的生產(chǎn)力提升10倍,需求會(huì)隨之增加,而不是減少的領(lǐng)域。

主持人:所以你的觀點(diǎn)是“學(xué)習(xí)編程依然有用”。計(jì)算機(jī)科學(xué)還是值得學(xué)的。那么在彈性崗位類別里,工程和產(chǎn)品管理肯定在內(nèi)。還有哪些?比如設(shè)計(jì)、用戶研究?

Brendan Foody:是的,還有很多環(huán)節(jié),整個(gè)公司構(gòu)建的價(jià)值鏈里都有這樣的變量。比如運(yùn)營(yíng)、咨詢。想象一下如果我們能有10倍的麥肯錫咨詢顧問,會(huì)產(chǎn)生多少研究和分析?但我認(rèn)為能成功的公司和個(gè)人,都是那些擁抱豐裕思維的人,思考“如何做得更多”,而不是抵抗“如何避免被替代”。

主持人:說到這里,就讓我想起你提到的第二類成功者——不是具體技能,而是會(huì)用AI,讓自己更強(qiáng)的人。這讓我想到馬斯克和Neuralink,他說未來AGI或超級(jí)智能出現(xiàn)時(shí),人類要想競(jìng)爭(zhēng),最好的辦法就是把大腦接入超級(jí)智能。這有點(diǎn)像現(xiàn)在的AI:熟練使用AI工具的人,其實(shí)就像獲得了超級(jí)能力。

Brendan Foody:沒錯(cuò),能學(xué)會(huì)如何利用并融入AI,將會(huì)至關(guān)重要。

主持人:對(duì),這其實(shí)就回到一句現(xiàn)在聽起來有點(diǎn)老套的話:AI不會(huì)取代你,會(huì)用AI的人會(huì)取代你。

Brendan Foody:我完全同意。在企業(yè)級(jí)別上我也確實(shí)看到了這種情況。有些公司害怕接觸,不想評(píng)估,因?yàn)橐坏┰u(píng)估就等于承認(rèn)價(jià)值鏈正在被自動(dòng)化。但也有一些公司——一些最知名、最復(fù)雜的財(cái)富500企業(yè)——正積極擁抱這種思維:如果我們能多做10倍、100倍,會(huì)意味著什么?未來10年會(huì)有那么多改變,而這些公司將會(huì)是最成功的。

未來招聘市場(chǎng)走向:AI修改簡(jiǎn)歷泛濫,需要智能篩選機(jī)制

主持人:我們?cè)倭幕貏趧?dòng)市場(chǎng)。你們公司最初并不是要把人送去AI實(shí)驗(yàn)室,不是為了訓(xùn)練模型,而是幫助人找工作、幫助公司招聘。后來才發(fā)現(xiàn)了這個(gè)巨大的機(jī)會(huì)。所以你們對(duì)未來勞動(dòng)市場(chǎng)和招聘的走向有很獨(dú)特的看法,能談?wù)剢幔?/span>

Brendan Foody:是的。我還記得我們剛創(chuàng)業(yè)時(shí)(當(dāng)時(shí)我19歲),只是有個(gè)直覺:勞動(dòng)力市場(chǎng)過于低效和分散。什么意思呢?比如我們要在全球招聘,候選人會(huì)申請(qǐng)十幾份工作。但作為一家灣區(qū)公司,我們只會(huì)考慮市場(chǎng)上極小一部分候選人。原因是匹配問題必須人工解決:人工篩簡(jiǎn)歷、人工面試、人工決定雇誰。但如果這個(gè)匹配問題能用軟件自動(dòng)化解決,就能形成一個(gè)全球統(tǒng)一的勞動(dòng)市場(chǎng)——所有候選人都申請(qǐng)到同一個(gè)市場(chǎng),所有公司都從同一個(gè)市場(chǎng)招聘,信息流動(dòng)更加順暢。毫無疑問,這就是未來的方向。但我們后來意識(shí)到,工作的本質(zhì)也在劇烈變化。而在未來10年的建設(shè)中,除了打造市場(chǎng),我們還需要通過評(píng)估和RL環(huán)境數(shù)據(jù)集為客戶創(chuàng)造未來的工作形態(tài)。

主持人:我看到的招聘趨勢(shì)也印證了這一點(diǎn)。我跟合作伙伴Gnome一起做過研究:現(xiàn)在投簡(jiǎn)歷變得太容易了,大家都能用AI快速改簡(jiǎn)歷、寫求職信,一口氣投幾百家公司。招聘經(jīng)理這邊就被簡(jiǎn)歷海淹沒了,所以不得不依賴AI來篩選。即使我們不想走到這一步,也被推著走:申請(qǐng)量和招聘量的暴增,迫使我們必須有更智能的過濾和選擇機(jī)制。這正是你們這些年來一直在構(gòu)建的。

Brendan Foody:沒錯(cuò)。很多人會(huì)問:我們到底是勞動(dòng)市場(chǎng)公司,還是數(shù)據(jù)公司?這個(gè)問題有意思,因?yàn)槲覀円庾R(shí)到實(shí)驗(yàn)室真正需要的其實(shí)是勞動(dòng)市場(chǎng)。他們需要的是那些頂尖的專業(yè)人才。當(dāng)然我們會(huì)附加一些項(xiàng)目管理和軟件平臺(tái),但核心是:如何找到這些跨領(lǐng)域的高水平專家,來測(cè)評(píng)模型能力,并共同構(gòu)建未來的工作形態(tài)。

人的質(zhì)量,決定ChatGPT的質(zhì)量

主持人:回到你們的業(yè)務(wù)。我和朋友聊過一件事:他腳踝扭傷,拍了X光片,然后把片子扔給ChatGPT,讓它分析。結(jié)果它真的給出診斷了。他就問我:“這模型是怎么知道的?網(wǎng)上哪里有這樣的訓(xùn)練數(shù)據(jù)?”我告訴他,不是這樣,其實(shí)是有人在幫模型理解——當(dāng)它不會(huì)時(shí),人類會(huì)教它。所以模型的學(xué)習(xí)背后,是人類在不斷提供幫助。

Brendan Foody:沒錯(cuò)。其實(shí)運(yùn)作的方式,至少大多數(shù)人的理解是這樣的:模型的工作原理很復(fù)雜,預(yù)訓(xùn)練把大量知識(shí)灌進(jìn)模型里,相當(dāng)于讓它見過世界上各種事物。然后后訓(xùn)練和強(qiáng)化學(xué)習(xí),才是幫助模型區(qū)分哪些知識(shí)是準(zhǔn)確的、哪些是不準(zhǔn)確的,以及在特定時(shí)刻該如何優(yōu)先取舍來做出決定。在這背后,其實(shí)就有放射科醫(yī)生參與后訓(xùn)練數(shù)據(jù)集的標(biāo)注,他們會(huì)設(shè)定一個(gè)參考點(diǎn)——比如診斷結(jié)果,并配上相應(yīng)的獎(jiǎng)勵(lì)或懲罰機(jī)制。

Brendan Foody:最終,正是這些人的質(zhì)量,決定了 ChatGPT 的決策和推薦的質(zhì)量。

主持人:那我們繼續(xù)展開一下,因?yàn)檫@真的很有意思,我覺得沒多少人真正理解。我大概能理解。所以你們和這些專家做的工作,其實(shí)是“后訓(xùn)練”。這不是往模型預(yù)訓(xùn)練階段去喂數(shù)據(jù),而是說:我們已經(jīng)有了 GPT-5 模型,然后要補(bǔ)上它缺失的東西,再加強(qiáng)它。對(duì)吧?

Brendan Foody:對(duì)。更準(zhǔn)確地說,這是幫助模型從預(yù)訓(xùn)練里篩選正確的 token,強(qiáng)化正確的推理鏈,讓模型能更通用、更好地推理。

主持人:有多少人規(guī)模在做這件事?是幾千、幾萬人,還是幾十萬人?

Brendan Foody:通常是幾萬人同時(shí)在做,更廣泛來說是幾十萬人。規(guī)模非常大。而且最令人興奮的是它增長(zhǎng)得非常快。你剛才提到競(jìng)爭(zhēng)格局——過去主要是一些眾包公司雇傭大量低技能勞動(dòng)力,比如 Scale 和 Surge 這類公司算是行業(yè)的先驅(qū)。但現(xiàn)在過渡到高技能勞動(dòng)后,人們發(fā)現(xiàn)只要找到更高水平的人才,即便數(shù)量少一些,價(jià)值也能遠(yuǎn)遠(yuǎn)更大。等到滿足質(zhì)量標(biāo)準(zhǔn)后,再逐步放大規(guī)模。我們的快速增長(zhǎng)和營(yíng)收成功,也吸引了一批后來者追隨這個(gè)市場(chǎng)邏輯,這是合理的。

主持人:挺有意思。

主持人:其實(shí)一直有一些公司,比如 AlphaSites 和 GLG,在 AI 之前就做過類似的事:花錢把人和專家連線,問他們問題。現(xiàn)在事實(shí)證明這對(duì)模型也很有用,只不過不再需要“中間人”。

Brendan Foody:沒錯(cuò)。

Brendan Foody:但核心區(qū)別在于:AlphaSites 通常只是“一次性電話咨詢”,而我們更多是把人招進(jìn)來做項(xiàng)目,需要他們長(zhǎng)期投入。這也是為什么傳統(tǒng)專家網(wǎng)絡(luò)很難切入這一領(lǐng)域。另外,你還要考慮怎么長(zhǎng)期留住這些人,以及建立起合理的激勵(lì)機(jī)制。某種程度上,它更像 Uber 或 DoorDash 這樣的勞動(dòng)市場(chǎng),只不過我們對(duì)接的是高技能人才,并且給予非常優(yōu)厚的待遇。

主持人:我今天學(xué)到好多東西,所以我想多問幾個(gè)問題。你們找的專家,到底是更多偏“硬知識(shí)”,還是偏“人格和軟技能”?比如具體到:怎么做檢查,怎么做 X 光?

Brendan Foody:要看不同實(shí)驗(yàn)室的需求,兩者都有。以前可能更偏軟技能,但現(xiàn)在很多實(shí)驗(yàn)室聚焦的是商業(yè)模式:哪些能力能直接帶來收入,所以更傾向于專業(yè)領(lǐng)域的硬技能。不過創(chuàng)意類能力同樣很重要。比如幾個(gè)月前我們就把哈佛 Lampoon 喜劇社整隊(duì)招了進(jìn)來,讓模型變得更幽默。我們也會(huì)請(qǐng)艾美獎(jiǎng)編劇,或者各類創(chuàng)意人才,來提升模型的創(chuàng)造力。

24小時(shí)內(nèi)交付專家,只需留住前10%的人,時(shí)薪最高達(dá)500美刀

主持人:這故事太酷了。我迫不及待想看到效果。這種改進(jìn)見效要多久?幾個(gè)月還是幾年?

Brendan Foody:要看實(shí)驗(yàn)室。有些模型會(huì)迭代式更新,幾周就悄悄改進(jìn)一次;有些則會(huì)搞“大版本發(fā)布”。我們?cè)谒羞@些實(shí)驗(yàn)室背后提供支持。我們動(dòng)作很快,比如客戶說要找獲獎(jiǎng)編劇,我們能在 24 小時(shí)內(nèi)交付專家。還有個(gè)很有趣的現(xiàn)象:我們雇的 100 個(gè)人里,往往前 10% 的人貢獻(xiàn)了大部分改進(jìn)。就像一家公司,10% 的頂尖員工決定了大部分產(chǎn)出。這意味著只要我們能識(shí)別并留住那前 10% 的人,再把他們高效匹配到項(xiàng)目里,就能創(chuàng)造巨大的客戶價(jià)值,也形成了競(jìng)爭(zhēng)壁壘。這正是公司最初的核心邏輯:找到卓越人才,并持續(xù)把他們帶給客戶。

主持人:那具體來說,比如你們招了一個(gè)叫 Jane 的人,她很會(huì)寫代碼,她會(huì)不會(huì)就被 Anthropic 全職雇走?還是說主要是兼職、項(xiàng)目制?

Brendan Foody:都有。有時(shí)是全職,但多數(shù)是兼職。比如有些人在大廠工作,節(jié)奏慢,手里還有 20 小時(shí)富余時(shí)間,就會(huì)來做這類任務(wù)。當(dāng)然我們也提供很多 40 小時(shí)全職崗位。

主持人:那收入呢?對(duì) FAANG 工程師來說值得嗎?

Brendan Foody:非常值得。我們平臺(tái)的中位時(shí)薪是 95 美元,最高可以到 500 美元/小時(shí),取決于專業(yè)深度。對(duì)比傳統(tǒng)眾包平臺(tái),他們一般平均只付 30 美元/小時(shí),所以只能雇些本科生。而我們能吸引到高盛銀行家、麥肯錫顧問、FAANG 工程師。最終還是要看實(shí)驗(yàn)室需要的能力,大多數(shù)需求還是落在后者這些高技能人群身上。

Claude代碼為什么領(lǐng)先?評(píng)測(cè)!

主持人:我知道你不能說太多客戶細(xì)節(jié),但比如 Anthropic Claude 在寫代碼方面一直領(lǐng)先于其他模型,還能寫得很好。我也用它做寫作反饋。為什么他們能這么強(qiáng)?

Brendan Foody:我不能講太細(xì)。但整體趨勢(shì)就是:強(qiáng)化學(xué)習(xí),以及認(rèn)真定義正確的獎(jiǎng)勵(lì)機(jī)制,避免獎(jiǎng)勵(lì)黑客化,才讓模型越來越好。這就是評(píng)測(cè)的威力。客戶經(jīng)常說:“模型的好壞取決于它的評(píng)測(cè)。”這句話一直成立。

主持人:我記得 Greg Brockman 發(fā)過一句話:“Evals are all you need。”確實(shí)如此。

抓住史上最大商機(jī):領(lǐng)先指標(biāo)、客戶至上,強(qiáng)推PMF無意義

主持人:我們聊回Mercor 本身吧。你們可能是歷史上增長(zhǎng)最快的公司了。 

我想了解你們是怎么做到的。你認(rèn)為 Mercor 成功的核心要素是什么?

Brendan Foody:最重要的是抓住快速變化市場(chǎng)里的領(lǐng)先指標(biāo)。以前在風(fēng)投圈,大家總說“為什么是現(xiàn)在(Why Now)”。我一開始理解為產(chǎn)品層面的時(shí)機(jī),比如現(xiàn)在能自動(dòng)化篩簡(jiǎn)歷、做面試。但其實(shí)關(guān)鍵在于市場(chǎng)。你要找到那些變化飛快的新市場(chǎng)和新需求點(diǎn)——世界上最有錢的客戶愿意為提升模型能力花任何代價(jià)。我們就要盯住這些領(lǐng)先信號(hào),把一切資源優(yōu)化到為頭部客戶提供最好的解決方案上。這是最有影響力的一點(diǎn)。

另一個(gè)核心是客戶至上。在公司成立一年半里,我們沒有銷售團(tuán)隊(duì),也沒有市場(chǎng)團(tuán)隊(duì),100% 的資源都放在打磨產(chǎn)品和體驗(yàn)。靠口碑傳播,客戶在別的公司工作時(shí)還想繼續(xù)用我們。這就是我們花所有時(shí)間的地方。很多創(chuàng)業(yè)者容易過早糾結(jié)“怎么做好市場(chǎng)推廣”,但真正重要的是:先把讓客戶愛上的“六星體驗(yàn)”做到。

主持人:我想回到你剛才說的,你們發(fā)現(xiàn)了一個(gè)可能是“史上最大商機(jī)”的口袋市場(chǎng)。你們是怎么第一次意識(shí)到的?

Brendan Foody:這背后有些瘋狂的故事。我們?cè)?nbsp;2023 年 1 月成立公司,到 2023 年 8 月,我還在上大學(xué)。有客戶把我們介紹給 xAI 的聯(lián)合創(chuàng)始人,說我們有一批數(shù)學(xué)和編程很強(qiáng)的印度工程師。我們見面后強(qiáng)調(diào)他們的強(qiáng)項(xiàng)就是因?yàn)椴挥帽蝗宋膶W(xué)科分心,不用學(xué)歷史英語這些,他們很喜歡。兩天后,xAI 就請(qǐng)我們?nèi)?nbsp;Tesla 辦公室,見了整個(gè)聯(lián)合創(chuàng)始團(tuán)隊(duì)(除了 Elon)。當(dāng)時(shí) xAI 剛成立,他們對(duì)我們“專家質(zhì)量?jī)?yōu)先”的理念非常興奮。雖然他們那時(shí)還在做預(yù)訓(xùn)練,不急著要人類數(shù)據(jù),所以沒有立刻合作,但我們已經(jīng)意識(shí)到市場(chǎng)會(huì)徹底變革,我們必須走在前沿。

再往后幾個(gè)月,一家眾包公司來用我們的平臺(tái)雇了上千人。結(jié)果我們收到大量工單,投訴他們沒拿到錢。我們很愧疚,因?yàn)槲覀兺扑]的機(jī)會(huì)竟然沒兌現(xiàn)。這讓我們意識(shí)到:很多老牌公司在人才體驗(yàn)上完全停滯,人才被當(dāng)作廉價(jià)消耗品。但其實(shí)可以直接和實(shí)驗(yàn)室合作,既保證專家尊嚴(yán)、又支付高薪,同時(shí)切掉中間環(huán)節(jié)。于是我們?cè)?/span>2024 年 5 月開始直接對(duì)接實(shí)驗(yàn)室,后面的故事你就知道了。

主持人:哇。

主持人:這就帶來了上億美元的營(yíng)收。所以總結(jié)一下,你們的思路是:先敏銳捕捉“需求拉力”,然后一旦確認(rèn)市場(chǎng)有意義,就全力把客戶體驗(yàn)做到極致。

Brendan Foody:對(duì)。如果給創(chuàng)業(yè)者一句建議,就是:別老想著“強(qiáng)推產(chǎn)品市場(chǎng)匹配”。當(dāng)然,你需要堅(jiān)持自己的世界觀,認(rèn)為世界會(huì)如何變化,但有時(shí)市場(chǎng)本身會(huì)告訴你“拉力”在哪。要找到那些非常容易成交的客戶,因?yàn)槟谴硭麄兺袋c(diǎn)極大、需求迫切。如果每個(gè)客戶都得拼命去推銷,那業(yè)務(wù)做不大。你需要找到“輕而易舉就能成交的客戶”,那才是增長(zhǎng)的核心。所以既要對(duì)未來的假設(shè)保持執(zhí)著,又要對(duì)市場(chǎng)的具體走向保持開放,隨時(shí)調(diào)整。

主持人:這真是一個(gè)了不起的洞見。

主持人:在你剛剛描述的那些時(shí)刻里,感覺像是兩個(gè)關(guān)鍵點(diǎn)疊加在一起:一個(gè)是和 xAI 的會(huì)面——你們意識(shí)到,“哇,他們真的、真的很想要我們手上這點(diǎn)東西,雖然我們做得還不夠完美”;另一個(gè)就是平臺(tái)上一千人的大規(guī)模招聘。

主持人:是不是就是這兩個(gè)瞬間讓你們覺得:“對(duì),就是這樣”?

Brendan Foody:沒錯(cuò)。而且要注意,這些事發(fā)生的時(shí)候,我們還只是一個(gè)種子輪階段的公司。第一個(gè)是在我們拿到任何種子輪融資之前,當(dāng)時(shí)完全是自力更生。我們把公司做到了一百萬美元的收入運(yùn)行率,始終保持極高的資本效率,從沒燒過錢,整體上一直是盈利的。然后我們?cè)?nbsp;9 月份拿到了 General Catalyst 的種子輪投資。第二個(gè)經(jīng)驗(yàn),就是在那之后我們真正看清了這個(gè)市場(chǎng)存在巨大的需求——我們看到了量,看到了老玩家其實(shí)對(duì)市場(chǎng)的變化和所需人才有點(diǎn)“睡過去”了。

老外也在996,持續(xù)成功的三個(gè)價(jià)值觀:can-do、高標(biāo)準(zhǔn)、強(qiáng)度

主持人:看到機(jī)會(huì)并開始執(zhí)行是一回事,但能在這樣的規(guī)模下持續(xù)成功是另一回事。你們公司內(nèi)部有一些非常具體的價(jià)值觀,請(qǐng)談?wù)勥@些。我感覺這也是你們成功的重要原因。

Brendan Foody:確實(shí)如此。我可以分享三個(gè)核心價(jià)值觀,并且每個(gè)都講個(gè)小故事。

第一個(gè)是“能做的態(tài)度(can-do attitude)”。大家總是拿這個(gè)說笑,但我們真的一直在設(shè)定看起來瘋狂的目標(biāo),然后公司的軌跡竟然真的圍繞著這些目標(biāo)展開。我記得在 Benchmark 帶領(lǐng)我們 A 輪融資之前,我們當(dāng)時(shí)收入運(yùn)行率是 150 萬美元,我說我們年底會(huì)做到 5000 萬,他們覺得我們瘋了。結(jié)果前后兩周的差距,我們真的做到了。而且今年我們?cè)缇瓦h(yuǎn)遠(yuǎn)超過了最初定的 5 億美元運(yùn)行率目標(biāo)。所以,不管是營(yíng)收規(guī)模還是人才體驗(yàn),我們都會(huì)設(shè)定極度雄心勃勃的目標(biāo),而“能做的態(tài)度”是第一條。

第二個(gè)是高標(biāo)準(zhǔn)。不管是招聘還是日常期望,我們的門檻都非常高。我們雇了很多前創(chuàng)業(yè)者,背景非常優(yōu)秀的人才。比如我們剛剛請(qǐng)來 Sandeep Jain 擔(dān)任總裁,他之前是 Uber 的首席產(chǎn)品官和首席技術(shù)官。Uber 當(dāng)然是全球最大的勞動(dòng)市場(chǎng),而他愿意加入我們這種相對(duì)還小的公司,就是為了幫我們把流程規(guī)模化。

第三個(gè)是強(qiáng)度(intensity)。看看 Meta 或 Google 的早期文化,都有那種極度強(qiáng)烈的“推山移海”的勁頭。我們公司也是這種氛圍——注重輸出結(jié)果,而不是考核你具體坐多少小時(shí)。但大家都清楚,要建立一家傳奇公司,就必須投入巨大的強(qiáng)度。

主持人:我能理解為什么這套能行。

“能做的態(tài)度 + 高標(biāo)準(zhǔn) + 強(qiáng)度”,聽起來就是成功組合。現(xiàn)在外界很多討論 996、699 這種文化(每天 早9 點(diǎn)到晚 9 點(diǎn),每周 6 天)。很多人覺得這很糟糕,為什么要這樣壓榨員工?但與此同時(shí),我不斷聽到頂級(jí) AI 公司都在說,這是成功的必然。機(jī)會(huì)太難得,速度太快,錯(cuò)過就沒了。你怎么看?

Brendan Foody:我需要澄清一點(diǎn):我們從來沒有強(qiáng)制規(guī)定工時(shí)。這更多是自然而然的結(jié)果——大家都很在乎公司的發(fā)展軌跡。很多人會(huì)自愿留下來加班,但如果他們要早點(diǎn)走去陪孩子吃飯,或者周末要出行,那完全沒問題。對(duì)我們來說,關(guān)鍵在于找到那些有強(qiáng)烈主人翁意識(shí)、真正認(rèn)同公司使命的人,而不是盯著他們坐在辦公室多少小時(shí)。只是現(xiàn)實(shí)往往是——最認(rèn)同的人,通常也就是那些愿意和我們一起熬夜的人。

主持人:當(dāng)你說“高標(biāo)準(zhǔn)”的時(shí)候,有沒有什么具體的例子可以說明你們的要求到底有多高?

很多人覺得自己有高標(biāo)準(zhǔn),但其實(shí)并沒有。

Brendan Foody:如果你足夠耐心,就能在招聘中把質(zhì)量和速度之間的權(quán)衡做好。我記得我們前 10 個(gè)員工的招聘過程,就異常耐心和嚴(yán)格。比如我們?cè)诿绹?guó)的第二個(gè)員工 Sid,之前是 Scale 的增長(zhǎng)主管,他加入我們的時(shí)候我們還只是種子公司。還有 Daniel,他曾經(jīng)把兩個(gè)消費(fèi)級(jí)應(yīng)用做到 10 萬以上用戶。這些人背景都非常不凡。最初那 10 個(gè)員工的“人才密度”,極大地塑造了公司后續(xù)擴(kuò)張時(shí)的文化和格局。

招人的快與慢

主持人:我知道你們還有個(gè)觀點(diǎn)是:外界經(jīng)常說“招人要慢”,但你認(rèn)為這并不總是對(duì)的。能展開講講嗎?

Brendan Foody:這確實(shí)是把雙刃劍。一方面,我很高興我們前 10 個(gè)員工都如此優(yōu)秀,這對(duì)公司幫助巨大。但另一方面,公司到了一定規(guī)模,就必須快速招聘。有些工作就是需要大量人力來完成。你必須承認(rèn),快速招聘一定會(huì)帶來一定差異性,但此時(shí)速度更重要。某種意義上,我們?cè)趫F(tuán)隊(duì)擴(kuò)張上其實(shí)走得有點(diǎn)慢了。好處是每個(gè)人都很強(qiáng),我們保持了高門檻。但壞處就是,即使公司已經(jīng)成長(zhǎng)得很快了,其實(shí)我們本可以更快,如果我們?cè)趶?nbsp;10 人擴(kuò)張到 100 人這段時(shí)間里能更迅速些。

主持人:所以前 10 人要謹(jǐn)慎,之后 10 到 100 人要加快?

Brendan Foody:差不多吧,但我不會(huì)說一定是“10”這個(gè)數(shù)字。關(guān)鍵點(diǎn)是:一旦你清楚公司真的跑通了,市場(chǎng)需求遠(yuǎn)超你能承接的范圍,那就是要“踩油門”的時(shí)候,速度比什么都重要。但在此之前,耐心和高標(biāo)準(zhǔn)依然最重要。

高速增長(zhǎng)下CEO的兩件事

主持人:你之前還創(chuàng)過幾家公司,規(guī)模都比較小。現(xiàn)在作為一家超高速增長(zhǎng)公司 CEO,最讓你意外的是什么?很多人夢(mèng)想當(dāng) CEO,但可能想象不到日常的重點(diǎn)。

Brendan Foody:其實(shí)沒什么太意外的。最主要的兩個(gè)方面依然是招聘和客戶。第一是怎么找到、培養(yǎng)最強(qiáng)的團(tuán)隊(duì);第二是怎么真正理解客戶需要什么,以及我們?nèi)绾沃С炙麄儭.?dāng)然,還有很多臨時(shí)出現(xiàn)的管理事務(wù),比如組織架構(gòu)、薪酬等級(jí)等等,這是隨著公司規(guī)模化才會(huì)遇到的。但核心時(shí)間花在招聘和客戶上,這和我之前的預(yù)期一致,也正好是我最喜歡做的事,這算是幸運(yùn)吧。

從甜甜圈到AWS項(xiàng)目:行動(dòng)比想法更重要

主持人:你過去創(chuàng)的那兩家公司,能分享一下嗎?我覺得挺有趣。它們又是如何幫助你在現(xiàn)在的角色里更成功的?

Brendan Foody:我之前搞過十幾個(gè)項(xiàng)目,挑兩個(gè)最喜歡的吧。一個(gè)是我八年級(jí)時(shí)開的 甜甜圈王國(guó)(Donut Dynasty)。當(dāng)時(shí)發(fā)現(xiàn) Safeway 賣一打甜甜圈才 5 美元,我覺得太劃算了。于是我騎車去買,再拿回學(xué)校,一個(gè)賣 2 美元。賣得飛快。我后來請(qǐng)我媽開車送我去批量進(jìn)貨,一次買十打帶回來賣。后來學(xué)校禁止我在校園賣食物,我就把攤子挪到校門口 50 英尺之外,說他們沒權(quán)力管我。競(jìng)爭(zhēng)對(duì)手也出現(xiàn)了,有人賣更高檔的 Chuck’s Donuts,一只就要 1 美元。我于是把價(jià)格壓到 1 美元兩個(gè),撐了兩周把他們擠出市場(chǎng)(當(dāng)時(shí)我還不知道這叫反競(jìng)爭(zhēng))。我還雇朋友幫賣,用甜甜圈支付他們的勞務(wù),他們覺得值 2 美元一只。就是各種有趣的商業(yè)博弈。

另一個(gè)是我高中時(shí)期做的 AWS 相關(guān)業(yè)務(wù),規(guī)模更大一些。但我從這些經(jīng)歷里得到的最大收獲就是:行動(dòng)比想法更重要。很多人都有點(diǎn)子,但很少人真正去做。只要你愿意開始做、去滿足客戶需求,并投入精力和野心,就能把事情做起來。這些練習(xí)讓我明白,后來應(yīng)該在更大規(guī)模上干同樣的事。

主持人:哈哈,這個(gè)故事太棒了。

主持人:我最喜歡的是你給你媽 20 美元當(dāng)“運(yùn)費(fèi)”。

Brendan Foody:對(duì),她堅(jiān)持說這不是白幫忙,得算她的時(shí)間成本。她還要求給她一個(gè)頭銜,我們最后笑著把她封為“全球運(yùn)營(yíng)總監(jiān)”。

主持人:希望她把這寫進(jìn) LinkedIn。

Brendan Foody:還沒,不過也許以后會(huì)加上。

主持人:你說自己開過十幾家公司。

Brendan Foody:算是十幾個(gè)項(xiàng)目吧,但真正做大的就是甜甜圈生意和 AWS 公司。

主持人:那“Mercor” 這個(gè)名字有什么故事?

Brendan Foody:“Mercor” 在拉丁語里是市場(chǎng)、買賣、交易的意思。我們想打造全球最大的市場(chǎng),一個(gè)所有人找工作的市場(chǎng)。所以就取了這個(gè)名字。

寫eval的專家,正在創(chuàng)造最高增速的公司

主持人:好的。最后一個(gè)問題吧。回到前面的話題:現(xiàn)在大家都說,過去是“數(shù)據(jù)驅(qū)動(dòng)模型”,現(xiàn)在變成“專家驅(qū)動(dòng)模型”。你覺得下一步是什么?會(huì)不會(huì)走向 AGI?

Brendan Foody:我不覺得是從“數(shù)據(jù)”轉(zhuǎn)向“專家”,更準(zhǔn)確地說是:實(shí)驗(yàn)室必須和專家密切合作,來設(shè)計(jì)好評(píng)測(cè)(evals),推動(dòng)模型前沿。很清楚的一點(diǎn)是,只要我們還想提升模型,就需要專家來設(shè)計(jì)評(píng)測(cè),提供后訓(xùn)練數(shù)據(jù),讓模型學(xué)到能力。當(dāng)然,訓(xùn)練方式可能會(huì)變,比如不同的 RL 方法,但始終都需要評(píng)測(cè)來衡量在各個(gè)領(lǐng)域里什么才是成功。

三年內(nèi)不會(huì)有超級(jí)智能

主持人:好,那在這個(gè)基礎(chǔ)上,我想問一個(gè)現(xiàn)在常被提起的問題。規(guī)模定律以及模型智能的進(jìn)展。很多人覺得,好像放緩了。按照這樣的速度,我們可能真的無法達(dá)到超級(jí)智能。你的看法是什么?

Brendan Foody:我完全同意這種看法。雖然有些大實(shí)驗(yàn)室的高管說我們?nèi)陜?nèi)會(huì)有超級(jí)智能,但我認(rèn)為事實(shí)是,這條路會(huì)更長(zhǎng)。這并不是貶低當(dāng)前模型的能力——我認(rèn)為在未來十年內(nèi),我們一定能自動(dòng)化掉大多數(shù)知識(shí)型工作的任務(wù)。但這條漫長(zhǎng)的道路,靠的將是各種評(píng)測(cè)(evals),幫助模型獲得這些能力。實(shí)現(xiàn)這一切的關(guān)鍵不在于“再多10倍的預(yù)訓(xùn)練數(shù)據(jù)”,而在于更高效、更精心設(shè)計(jì)的后訓(xùn)練數(shù)據(jù)集,它們才會(huì)推動(dòng)能力進(jìn)化。

主持人:David Sachs 曾經(jīng)發(fā)過一條推文,說我們現(xiàn)在的情況其實(shí)是最佳情境:AI 沒有進(jìn)入極速躍升到超級(jí)智能的狀態(tài);有很多競(jìng)爭(zhēng)者彼此制衡;模型已經(jīng)很有價(jià)值,而且越來越有價(jià)值;但并沒有出現(xiàn)某個(gè)“贏家”型超級(jí)智能主宰世界的局面。

Brendan Foody:是的,我覺得這沒錯(cuò)。我認(rèn)為關(guān)于超級(jí)智能的恐慌有些被夸大了。但同時(shí),很多人的框架是:即便只有 5%-10% 的概率會(huì)出現(xiàn)這種情況,我們也該保持謹(jǐn)慎——這聽上去也合理。但我覺得未來十年對(duì)硅谷乃至全世界來說都會(huì)是非凡的,因?yàn)檫@項(xiàng)技術(shù)能夠帶來真正的豐裕——讓每個(gè)人都能獲得更好的醫(yī)療、更優(yōu)質(zhì)的法律咨詢,以及前所未有的產(chǎn)品創(chuàng)造能力。

主持人:教育也正在被徹底改變。

主持人:完全正確,對(duì)嗎?

Brendan Foody:是的,我自己這十年來也深有體會(huì)。比如我記得大學(xué)時(shí),父母總批評(píng)我不去上課,但我當(dāng)時(shí)就覺得,YouTube 上的課程講得更好,為什么不直接在那里學(xué)?而且我可以想象,當(dāng)模型的表達(dá)和教學(xué)能力遠(yuǎn)超最好的教授時(shí),這意味著什么——獲取各種知識(shí)的門檻大大降低,推動(dòng)人類進(jìn)步和全民技能提升。

AI產(chǎn)品漫談:喜歡ChatGPT語音模式、AI玩寵、Codex

主持人:那我就借這個(gè)問題,進(jìn)入今天的最后一個(gè)環(huán)節(jié)——AI 角落,這是我們播客的固定環(huán)節(jié)。你個(gè)人是怎么用 AI 來幫助工作或生活的?

Brendan Foody:我主要用它來寫文檔,這個(gè)很自然。另外,我也會(huì)和它對(duì)話,尋求建議。我覺得它就像一個(gè)思考伙伴,幫我理清思路。因?yàn)橛袝r(shí)候,跟同事或身邊的人不能把所有想法都說出來,但和 AI 聊,我就能更好地思考。

主持人:所以主要是用 ChatGPT 的語音模式?

Brendan Foody:是的,我很喜歡 ChatGPT 的語音模式,雖然還有改進(jìn)空間,但我對(duì)語音的未來非常興奮。

主持人:讓我給你看看我做的一個(gè)小東西。我原本沒打算提這個(gè)。有個(gè)叫 Eric Antoneau 的人,很多人推薦過他。他是個(gè)很有創(chuàng)造力的產(chǎn)品人,之前在 Facebook 待過。他做了一個(gè)叫 ParrotGPT 的項(xiàng)目,把 ChatGPT 塞進(jìn)毛絨玩具里,可以對(duì)話。他做了一只智慧小貓頭鷹,我現(xiàn)在沒帶過來。基本原理就是在玩具里縫一個(gè)小音箱,肩膀上貼一個(gè)磁鐵,就能隨時(shí)對(duì)話。

Brendan Foody:太棒了,兄弟。我愛死了,我一定要搞一個(gè)。我家里已經(jīng)有一些語音助手,但我更想要一個(gè) ChatGPT 語音助手。我真的很期待。我剛才還在想這個(gè)事。

主持人:是啊,為什么不能有一個(gè) ChatGPT 語音助手,就隨時(shí)在旁邊聽?而不是像手機(jī)那樣休眠,你得喊它一聲“嘿”。

Brendan Foody:沒錯(cuò),正是這樣。

主持人:好吧,他還在做 Kickstarter,我們會(huì)把鏈接貼出來,大家可以去支持。Brendan,在進(jìn)入最后的閃電問答環(huán)節(jié)之前,你還有什么想補(bǔ)充的嗎?

Brendan Foody:呼應(yīng)我們剛才談到的“主動(dòng)性”這個(gè)話題,我想鼓勵(lì)大家:尤其在 AI 時(shí)代,構(gòu)建產(chǎn)品和嘗試的門檻已經(jīng)低得多了,所以請(qǐng)邁出那一步,去做,去和用戶交流,去嘗試。因?yàn)槲矣X得,最大的障礙就是缺乏主動(dòng)行動(dòng)。只要我們能降低這一障礙,就會(huì)有更多創(chuàng)新。

主持人:對(duì)。現(xiàn)在太多人光是聽播客、看文章,但就是不去實(shí)踐。而如今,已經(jīng)是史上最容易動(dòng)手構(gòu)建、動(dòng)手嘗試的時(shí)代了。所以,一定要記住:Just do it。就像你當(dāng)年把甜甜圈攤往外挪了 50 英尺一樣。好,Brendan,下面我們進(jìn)入快問快答環(huán)節(jié),我有五個(gè)問題準(zhǔn)備好了。你準(zhǔn)備好了嗎?

Brendan Foody:準(zhǔn)備好了。

主持人:第一個(gè)問題:你最常推薦給別人的兩三本書?

Brendan Foody:《高效能管理》(High Output Management),這是一本關(guān)于如何運(yùn)營(yíng)公司的經(jīng)典;第二本是《從零到一》(Zero to One),大家都知道;第三本是《鞋狗》(Shoe Dog),我覺得它特別勵(lì)志。

主持人:最近你喜歡的一部電影或電視劇?

Brendan Foody:我很喜歡《奧本海默》。我最喜歡的電視劇是《金裝律師》(Suits),雖然不是最近的。如果說近期的話,就是《奧本海默》。

主持人:很酷。最近你發(fā)現(xiàn)并喜歡上的一個(gè)產(chǎn)品?

Brendan Foody:我很喜歡新版 Codex,我覺得它進(jìn)步巨大,非常驚艷。

主持人:你有沒有一句人生格言?

Brendan Foody:就是我們剛才說的那句:You can just do stuff。勇敢邁出那一步。

主持人:我本以為你要說“Can do”,畢竟這是你 Twitter 簽名。

Brendan Foody:也行,可以是“Can do”。

閱讀障礙者如何管理公司

主持人:兩句都不錯(cuò)。最后一個(gè)問題:你之前說過一個(gè)細(xì)節(jié),還沒對(duì)外分享過,就是你其實(shí)有閱讀障礙(dyslexia)。

Brendan Foody:是的。

主持人:能和大家聊聊嗎?畢竟你在這樣的情況下,還建立了史上增長(zhǎng)最快的公司。

Brendan Foody:我從不隱瞞,很多同事都知道。閱讀障礙確實(shí)讓處理大量郵件或文件很困難。但另一方面,它讓我思考方式不同,更有創(chuàng)造力,能看到別人未必注意到的市場(chǎng)變化。從管理角度來說,它讓我意識(shí)到:更應(yīng)該發(fā)揮團(tuán)隊(duì)成員的長(zhǎng)處,而不是執(zhí)著去彌補(bǔ)短板。因?yàn)橛行┦挛以僭趺淳氁膊粫?huì)做到最好,但我可以在自己的強(qiáng)項(xiàng)上不斷精進(jìn)。

主持人:這是我們節(jié)目里經(jīng)常出現(xiàn)的主題:專注優(yōu)勢(shì),而不是過度糾結(jié)于弱點(diǎn)。Brendan,這期節(jié)目太精彩了,我學(xué)到很多。最后兩個(gè)問題:第一,大家應(yīng)該知道 Mercor 現(xiàn)在在做什么、招什么崗位?第二,聽眾怎么能幫到你們?

Brendan Foody:當(dāng)然。我們正在大量招聘:運(yùn)營(yíng)團(tuán)隊(duì)的戰(zhàn)略項(xiàng)目負(fù)責(zé)人、工程團(tuán)隊(duì)的軟件工程師、研究員等等。大家可以直接去 Mercor.com 應(yīng)聘。也歡迎推薦朋友,因?yàn)槲覀兤脚_(tái)超過一半的人才都來自轉(zhuǎn)介紹。我們很希望和優(yōu)秀的人一起工作。這就是大家能幫到我們最大的方式。

主持人:太棒了。謝謝你來參加。

Brendan Foody:謝謝邀請(qǐng)。

主持人:好的,各位,再見!

好了今天的文章到這里就結(jié)束了。大模型已然走到了“evals”時(shí)代,更好的評(píng)估帶來更高質(zhì)量的模型和Agent,大家是否認(rèn)同呢?歡迎評(píng)論區(qū)交流。

參考鏈接:https://www.youtube.com/watch?v=ja6fWTDPQl4&t=8s

責(zé)任編輯:武曉燕 來源: 51CTO技術(shù)棧
相關(guān)推薦

2009-08-19 09:22:46

科技公司RIM

2013-04-15 10:20:24

SaaSOptimizely云服務(wù)

2023-02-17 15:12:45

2023-12-13 13:39:00

OpenAI薪酬AI

2023-04-15 19:37:50

OpenAIGPT-5

2023-07-01 08:30:48

ChatGPT人工智能

2023-04-18 15:03:24

模型數(shù)據(jù)

2023-03-13 07:46:10

ChatGPTOpenAI

2023-06-08 07:58:29

2014-01-24 09:31:18

微軟Office 365云計(jì)算

2024-03-05 07:41:34

2024-07-04 15:32:13

2023-10-09 16:25:36

2023-11-09 12:41:40

AI數(shù)據(jù)

2024-04-03 12:48:00

2025-02-19 09:40:58

2023-12-05 14:12:40

2021-01-23 19:18:39

科技人工智能反壟斷

2011-09-15 09:40:02

網(wǎng)易財(cái)富
點(diǎn)贊
收藏

51CTO技術(shù)棧公眾號(hào)

99久久久无码国产精品性色戒| 久久精品视频在线| 国产男女在线观看| wwwww在线观看免费视频| 美女一区二区三区| 欧美大片网站在线观看 | www在线观看黄色| 国产亚洲欧美激情| 91久久大香伊蕉在人线| 6080午夜伦理| 欧美一区综合| 亚洲亚裔videos黑人hd| 蜜桃视频无码区在线观看| 乱馆动漫1~6集在线观看| 亚洲欧洲国产日韩| 欧美色欧美亚洲另类七区| 99久久婷婷国产一区二区三区| 亚洲深夜福利| 欧美大奶子在线| 精品无码国产污污污免费网站| 日韩成人18| 色综合欧美在线| 人妻av无码专区| 91最新在线| 成人免费高清在线| 亚洲精品欧美日韩| 在线观看日批视频| 99热免费精品| 欧美激情二区三区| 在线日韩国产网站| 成人三级视频| 亚洲欧美国产另类| 无套内谢大学处破女www小说| 精品国产鲁一鲁****| 欧美色区777第一页| 久久国产乱子伦免费精品| 国精一区二区三区| 一区二区三区在线视频免费| 青青草原国产免费| 在线中文资源天堂| 国产日韩欧美精品在线| 就去色蜜桃综合| 人妻中文字幕一区| 大胆亚洲人体视频| 91大片在线观看| 国产白浆在线观看| 国产一区二区精品久久99| 久久国产柳州莫菁门| 无码人妻一区二区三区免费| 亚洲无线视频| 操91在线视频| 欧美日韩中文字幕视频| 五月天亚洲一区| 亚洲欧洲av一区二区三区久久| 国产午夜精品一区二区三区 | 性xxxx18| 丰满亚洲少妇av| 91中文字幕在线| 国产美女明星三级做爰| 国产伦精品一区二区三区免费迷 | 伊人伊成久久人综合网站 | 国产精品电影一区二区| 亚洲不卡中文字幕| 国产免费视频在线| 国产精品污www在线观看| 亚洲国产精品视频一区| 日本精品在线| 亚洲另类一区二区| 精品成在人线av无码免费看| 狂野欧美性猛交xxxxx视频| 亚洲午夜免费电影| 久久网站免费视频| 成人国产精品入口免费视频| 欧美精品久久天天躁| 97人人模人人爽人人澡| 99香蕉久久| 亚洲欧美视频在线| 999福利视频| 你懂的视频一区二区| 欧美精品videofree1080p| 好看的av在线| 免费观看30秒视频久久| 亚洲最大的成人网| 少妇av一区二区| 国产女人18毛片水真多成人如厕 | 精品不卡视频| 日本午夜人人精品| 国产又粗又长视频| 99精品欧美一区| 深夜福利成人| 黄色在线观看视频网站| 欧美午夜激情视频| 中文字幕在线视频精品| 国产精品一区二区中文字幕| 国产亚洲福利一区| 欧美色图亚洲天堂| 久久不射网站| 91美女福利视频高清| 偷拍精品一区二区三区| 亚洲欧洲一区二区三区| 性欧美大战久久久久久久| 国产原创一区| 亚洲国产精品一区二区三区| 91麻豆制片厂| 亚洲激情专区| 成人中文字幕+乱码+中文字幕| 日韩在线观看视频一区| 亚洲色图第一区| 黄在线观看网站| 麻豆精品一区| 亚洲性生活视频在线观看| 久久网中文字幕| 老色鬼精品视频在线观看播放| 国产99在线免费| 日韩成人影视| 91久久免费观看| 91传媒理伦片在线观看| 国产精品成人一区二区不卡| 欧美一级电影在线| 亚洲精品字幕在线| 亚洲欧洲国产日本综合| 天天天干夜夜夜操| 欧美aaaaa级| 色在人av网站天堂精品| www.av88| 2017欧美狠狠色| 亚洲中文字幕无码av永久| 激情综合五月| 日韩中文字幕免费视频| 成年人视频免费| 久久久天堂av| 鲁一鲁一鲁一鲁一色| 日韩影片在线观看| 欧美成人剧情片在线观看| 中文字幕在线观看1| 久久久电影一区二区三区| 欧美日韩一道本| 欧美黄色影院| 国内久久久精品| 亚洲精品福利网站| 一区二区三区四区精品在线视频 | 亚洲精品国产精品乱码| 国产iv一区二区三区| 国产精品无码电影在线观看 | 国产超碰91| 成人毛片av在线| 日韩视频一区二区| 久久久国产精品人人片| 国产高清亚洲一区| 欧美日韩激情四射| 99久久免费精品国产72精品九九| 欧美精品18videosex性欧美| 亚洲女人18毛片水真多| 亚洲综合色在线| 日韩女优在线视频| 激情文学一区| 国产一区再线| 亚洲精品福利电影| 亚洲新中文字幕| 一本一道人人妻人人妻αv| 国产精品女主播av| 五月天开心婷婷| 欧美日韩国产一区精品一区| 成人永久免费| 一区二区三区四区日本视频| 亚洲女人天堂视频| 一区二区视频播放| 亚洲品质自拍视频| 国产艳妇疯狂做爰视频 | 久久久久久国产精品久久| 亚洲高清视频网站| 狠狠躁夜夜躁人人爽天天天天97 | 成人欧美一区二区三区小说 | 国产午夜精品视频一区二区三区| 日韩一二三区| 欧美资源在线观看| 在线免费看av| 欧美α欧美αv大片| 亚洲欧美在线视频免费| 欧美国产日韩一二三区| 永久av免费在线观看| 亚洲国产91| 日韩高清av电影| 日韩视频在线直播| 欧美综合第一页| 免费av在线网站| 亚洲国产精久久久久久| 中国一区二区视频| 亚洲免费在线视频| 亚洲av无码一区二区三区人| 精品午夜久久福利影院| 日韩欧美一区二| 国产精品二区不卡| 韩国成人一区| 欧美一级免费| 97在线看福利| 黄色大片在线播放| 亚洲欧美日韩视频一区| 国产又粗又大又爽| 疯狂做受xxxx高潮欧美日本| www.99re6| 91麻豆福利精品推荐| √天堂资源在线| 日韩专区一卡二卡| 男女私大尺度视频| 性欧美69xoxoxoxo| 欧美日韩亚洲在线| 91久久精品无嫩草影院| 国产精品美女网站| 国产伦久视频在线观看| 色狠狠久久aa北条麻妃| 亚洲aⅴ在线观看| 日韩一级片在线观看| 波多野结衣黄色网址| 精品久久久久国产| 久草视频在线资源| 中文字幕在线视频一区| 国产美女免费无遮挡| 成人精品鲁一区一区二区| 免费黄频在线观看| 日韩精品福利网| 各处沟厕大尺度偷拍女厕嘘嘘| 欧美三级视频| 熟女视频一区二区三区| 欧美一区二区三区激情视频 | 天天射,天天干| 日韩一二三区不卡| 国产绿帽刺激高潮对白| 欧美探花视频资源| 无码人妻久久一区二区三区不卡| 亚洲成人高清在线| 久久亚洲成人av| 亚洲精品美腿丝袜| 成人在线观看小视频| 亚洲欧美综合另类在线卡通| 婷婷色一区二区三区| 久久一区二区三区四区| 一级做a爰片毛片| 成人爽a毛片一区二区免费| 无码人妻丰满熟妇区毛片蜜桃精品| 麻豆精品视频在线观看| 国产 porn| 日本不卡在线视频| 91制片厂毛片| 日韩avvvv在线播放| 国产免费视频传媒| 首页国产欧美日韩丝袜| 热久久精品免费视频| 日韩黄色免费电影| 韩国视频一区二区三区| 日本亚洲最大的色成网站www| 不卡av免费在线| 日本va欧美va瓶| 中文字幕在线视频精品| 国产精品一区一区三区| 亚洲欧洲国产视频| 成人午夜伦理影院| 素人fc2av清纯18岁| 久久精品欧美一区二区三区不卡 | 亚洲欧美激情国产综合久久久| 日韩欧美一二区| 免费a级片在线观看| 亚洲精品999| 每日更新在线观看av| 中文国产成人精品| 亚洲欧美成人影院| 亚州国产精品久久久| 亚洲人体视频| 国产精品久久久亚洲| 91精品一久久香蕉国产线看观看| 91网站在线免费观看| 97久久亚洲| 久久久免费看| 成人一区而且| 女人色极品影院| 久久激情久久| 九色精品蝌蚪| 91久色porny| 欧美日韩高清丝袜| 一区视频在线播放| 男女性高潮免费网站| 亚洲综合免费观看高清完整版| 国产福利拍拍拍| 在线观看av一区| 亚洲AV无码乱码国产精品牛牛| 亚洲精品wwwww| h视频在线播放| 欧美激情a在线| 日韩一级二级| 99三级在线| 色综合综合网| 欧美一区二区三区综合| 久久精品盗摄| 亚洲三级在线观看视频| 91在线视频网址| 搜索黄色一级片| 欧美性色视频在线| 国产乱子伦精品无码码专区| 日韩风俗一区 二区| 国产秀色在线www免费观看| 97婷婷大伊香蕉精品视频| 日本欧美在线| 久久精品成人一区二区三区蜜臀| 国产精品伦理久久久久久| 成熟丰满熟妇高潮xxxxx视频| 久久精品国产亚洲a| 国产乱了高清露脸对白| 最新不卡av在线| 在线免费观看国产精品| 精品国产乱码久久| 国产视频一区二区| 国产激情综合五月久久| 国产精品极品国产中出| 一本色道久久99精品综合| 亚洲欧美日韩国产综合精品二区| wwwww在线观看| 1024成人网| 秋霞av一区二区三区| 精品欧美一区二区久久| 黄色大片在线播放| 国产精品一久久香蕉国产线看观看| 精品午夜电影| 国产精品国产三级国产专区51| 国产xxxxhd| 国产精品性做久久久久久| 亚洲色图欧美色| 色欧美乱欧美15图片| 网站黄在线观看| 久久久久久香蕉网| 精品欧美视频| www亚洲国产| 麻豆精品视频在线观看免费| 免费看黄色三级| 色综合色综合色综合| 色中色在线视频| 51ⅴ精品国产91久久久久久| 国产成人精品亚洲线观看| 青草视频在线观看视频| 国产成人在线色| 黄色一级片在线| 日韩欧美一级片| 蜜桃传媒在线观看免费进入| 成人女保姆的销魂服务| 国产精品97| 亚洲精品在线视频播放| 国产欧美精品一区| 一区精品在线观看| x99av成人免费| 国产精一区二区| 久久久无码中文字幕久...| 国产一区二区三区蝌蚪| 成年人一级黄色片| 日韩欧美一区二区在线视频| 最新黄网在线观看| 成人免费观看网站| 在线看片欧美| 精品无码一区二区三区 | 无码毛片aaa在线| 国产精品资源网| 精品视频一区二区在线观看| 精品国产百合女同互慰| 女厕盗摄一区二区三区| 欧美日韩亚洲免费| 久久99蜜桃精品| 超碰手机在线观看| 亚洲成人动漫在线播放| 美女视频在线免费| 色播五月综合| 国产一区高清在线| 国产无码精品久久久| 日韩精品在线免费播放| 国产69精品久久久久按摩| 特级黄色录像片| 99久久婷婷国产综合精品电影| 在线免费观看av网址| 久久久电影免费观看完整版| 国内精品麻豆美女在线播放视频 | 青青草手机在线观看| 日韩电影免费观看中文字幕| 亚洲国产尤物| 久久天天东北熟女毛茸茸| 99精品欧美一区二区三区小说 | 国产美女情趣调教h一区二区| 久久精品aaaaaa毛片| 麻豆91精品视频| 国产 日韩 欧美 成人| 国产亚洲综合久久| 一区二区三区高清在线观看| 毛片一区二区三区四区| 亚洲三级在线观看| 亚洲欧美日韩免费| 成人免费观看a| 免费精品视频| 久久艹精品视频| 国产一区二区三区中文 | 免费观看在线色综合| 精品在线视频观看| 中文字幕欧美视频在线| 99久久婷婷国产综合精品青牛牛| 欧美性猛交xxx乱久交|