OpenAI內(nèi)部大重組!模型行為團(tuán)隊(duì)并入Post Training,負(fù)責(zé)人另起爐灶
OpenAI又要成立新團(tuán)隊(duì)了!
TechCrunch消息,OpenAI正在對(duì)其模型行為(Model behavior)團(tuán)隊(duì)進(jìn)行重組。
模型行為團(tuán)隊(duì),就是OpenAI內(nèi)部專門塑造模型“個(gè)性”的核心研究小組。迄今已參與GPT-4、GPT-4o、GPT-4.5與GPT-5等版本的后訓(xùn)練工作。
隨著重組的進(jìn)行,其創(chuàng)始負(fù)責(zé)人Joanne Jang,也正在組建一個(gè)名為OAI Labs的新研究團(tuán)隊(duì)。

Joanne介紹,OAI Labs的職責(zé)是探索人與AI協(xié)作的新范式。
這是一個(gè)以研究為導(dǎo)向的團(tuán)隊(duì),專注于發(fā)明和設(shè)計(jì)人們與人工智能協(xié)作的新接口。
OpenAI成立OAI Labs
作為模型行為團(tuán)隊(duì)改組行動(dòng)的一部分,OpenAI將會(huì)成立新的OAI Labs。
其使命是“發(fā)明并原型化人類與AI協(xié)作的全新交互方式”,重點(diǎn)不再局限于聊天或Agent模式,而是把AI視作“具備思考、創(chuàng)作、學(xué)習(xí)、連接能力的工具”。
目前實(shí)驗(yàn)室仍處于組建早期,但已明確的研究方向包括兩條主線。
其一是交互層面的探索,團(tuán)隊(duì)將圍繞“互動(dòng)工具”這一概念,設(shè)計(jì)可直接操控、可復(fù)用且能在迭代中實(shí)時(shí)反饋的多模態(tài)原型,幫助用戶更直觀地塑造模型意圖、在創(chuàng)作流程中隨時(shí)調(diào)轉(zhuǎn)方向,并以可視化方式呈現(xiàn)AI的多種推理路徑與中間結(jié)果。
其二是行為層面的延續(xù)研究,OAI Labs吸收了原模型行為團(tuán)隊(duì)在人格一致性、降低諂媚等處理方面的積累,將這些“后訓(xùn)練”調(diào)優(yōu)機(jī)制與新的交互范式聯(lián)動(dòng),使個(gè)性、安全性與創(chuàng)造力在同一框架內(nèi)協(xié)同演化。
新團(tuán)隊(duì)負(fù)責(zé)人Joanne Jang還表示,她希望在新的接口實(shí)驗(yàn)中融入硬件維度。
Joanne此前是模型行為團(tuán)隊(duì)負(fù)責(zé)人,工作內(nèi)容是引入新的模型能力,設(shè)計(jì)和實(shí)施模型的個(gè)性化特性、行為規(guī)范以及用戶交互策略。
上周,Joanne發(fā)推稱,她將離開模型行為團(tuán)隊(duì),并“在OpenAI開啟新的篇章”。
Joanne于2021年加入OpenAI,最初擔(dān)任產(chǎn)品經(jīng)理,負(fù)責(zé)將GPT-4、TTS和DALL·E 2等研究成果轉(zhuǎn)化為可供API和ChatGPT使用的產(chǎn)品。
學(xué)業(yè)方面,Joanne本科和碩士均在斯坦福就讀。
在加入OpenAI之前,她曾在Google Assistant從事自然語言理解方面的工作,專注于不確定性建模和對(duì)話機(jī)制的研究。
此外,她還曾擔(dān)任Dropbox產(chǎn)品經(jīng)理、斯坦福助教等工作,實(shí)習(xí)經(jīng)歷則包括蘋果、迪士尼等。
除了Joanne,模型行為團(tuán)隊(duì)的其他成員,也將進(jìn)行重組。
模型行為團(tuán)隊(duì)重組
今年8月,OpenAI首席研究官M(fèi)ark Chen在內(nèi)部備忘錄中宣布,該團(tuán)隊(duì)約14名研究人員將整體并入Post Training團(tuán)隊(duì),未來將向Post Training負(fù)責(zé)人Max Schwarzer匯報(bào)。
模型行為團(tuán)隊(duì)是OpenAI內(nèi)部專門塑造模型“個(gè)性”的核心研究小組,迄今已參與GPT-4、GPT-4o、GPT-4.5與GPT-5等版本的后訓(xùn)練工作。
這一改組的目的,將模型行為研究更緊密地融入核心開發(fā)流程,反映出了OpenAI對(duì)AI模型“個(gè)性”研究的重視。技術(shù)層面,模型個(gè)性塑造也將在指令微調(diào)與RLHF等后訓(xùn)練流程中同步完成。
OpenAI認(rèn)為,只有把人格設(shè)計(jì)與核心性能迭代綁定,才能在“溫度”與“非諂媚”之間取得穩(wěn)定平衡,并提高對(duì)敏感場(chǎng)景的響應(yīng)質(zhì)量。
整合后,Post Training團(tuán)隊(duì)將把模型行為團(tuán)隊(duì)多年積累的檢測(cè)指標(biāo)、評(píng)估用例納入其評(píng)測(cè)標(biāo)準(zhǔn),使行為調(diào)優(yōu)、事實(shí)一致性檢查和推理能力測(cè)試共同決定迭代節(jié)奏。
內(nèi)部文件稱,這種“行為-性能一體化”流程將作為OpenAI后續(xù)模型的固定開發(fā)范式,避免人格調(diào)整滯后于模型升級(jí)。
除了模型行為團(tuán)隊(duì),近期OpenAI內(nèi)部也完成了一系列人事調(diào)整。
重點(diǎn)放在了Applications部門建立上,該部門將統(tǒng)籌管理ChatGPT、Codex等產(chǎn)品線。
Fidji Simo擔(dān)任應(yīng)用部門CEO,是“1號(hào)人物”。她于今年5月加入OpenAI,在2024年3月已加入董事會(huì)。曾帶領(lǐng)Instacart成功上市,是IPO的關(guān)鍵人物。
ChatGPT的產(chǎn)品負(fù)責(zé)人Nick Turley、以及新加入的Vijaye Raji都向她匯報(bào)。
原來的首席產(chǎn)品官Kevin Weil將轉(zhuǎn)崗至研究部門,擔(dān)任新部門OpenAI for Science的副總裁,專注前沿創(chuàng)新,與Mark Chen緊密合作。






























