精品欧美一区二区三区在线观看 _久久久久国色av免费观看性色_国产精品久久在线观看_亚洲第一综合网站_91精品又粗又猛又爽_小泽玛利亚一区二区免费_91亚洲精品国偷拍自产在线观看 _久久精品视频在线播放_美女精品久久久_欧美日韩国产成人在线

51CTO首頁

AI.x社區

博客

學堂

公眾號矩陣

移動端

視頻課免費課排行榜短視頻直播課軟考學堂

全部課程軟考信創認證華為認證廠商認證 IT技術 PMP項目管理免費題庫

在線學習

文章資源問答課堂專欄直播

51CTO

鴻蒙開發者社區

51CTO技術棧

51CTO官微

51CTO學堂

51CTO博客

CTO訓練營

鴻蒙開發者社區訂閱號

51CTO軟考

51CTO學堂APP

51CTO學堂企業版APP

鴻蒙開發者社區視頻號

51CTO軟考題庫

AI.x社區

登錄/注冊
51CTO

中國優質的IT技術網站

51CTO博客

專業IT技術創作平臺

51CTO學堂

IT職業在線教育平臺

穿越時空111

LV.4

這個用戶很懶，還沒有個人簡介

帖子 62

聲望 537

關注 0

粉絲 1

社區頭條作者熱門內容榜上榜作者

私信

關注

主帖 62

回帖

SmartResume：快速、精準、靈活，阿里巴巴開源的簡歷解析新標桿！

在當今數字化時代，企業招聘面臨著海量簡歷的處理挑戰。傳統手動篩選簡歷的方式不僅效率低下，還容易出現錯誤。為解決這一痛點，阿里巴巴開源了SmartResume智能簡歷解析系統，旨在通過先進的AI技術，實現簡歷的自動化處理，提升招聘效率。一、項目概述SmartResume是由阿里巴巴開源的智能簡歷解析系統，融合了OCR文本提取、PDF元數據解析、版面檢測（YOLOv10模型）及輕量化大語言模型（Qwen30.6B微調版），支持PDF、圖片、Word等...

3天前 176瀏覽 0點贊 0回復 0收藏

騰訊KaLM-Embedding：高性能多語言文本嵌入模型的創新與實踐

在自然語言處理（NLP）領域，文本嵌入模型作為連接語言與機器學習的關鍵橋梁，一直備受關注。騰訊推出的KaLMEmbedding系列模型，憑借其卓越的性能和創新的技術架構，為文本嵌入領域帶來了新的突破。一、項目概述KaLMEmbedding是由騰訊團隊開發的一系列高性能文本嵌入模型，通過先進的訓練技術和高質量的數據集，顯著提升了文本嵌入的性能。最新版本KaLMEmbeddingV2在架構和訓練方法上進行了多項創新，例如移除因果注意力掩碼以...

3天前 175瀏覽 0點贊 0回復 0收藏

百度ERNIE 4.5：多模態大模型的創新突破與強大應用

隨著人工智能技術的飛速發展，大語言模型（LLM）和多模態模型（VLM）在自然語言處理和視覺理解領域展現出強大的能力。百度文心推出的ERNIE4.5模型家族，憑借其創新的異構混合專家架構（MoE）和高效的訓練與推理技術，成為當前AI領域的熱門研究對象。一、項目概述ERNIE4.5是百度文心推出的新一代大型多模態基礎模型家族，包含多種不同變體，涵蓋從0.3億到470億參數的模型。它采用異構混合專家架構（MoE），將參數分為文本、視覺...

3天前 218瀏覽 0點贊 0回復 0收藏

DeepEyesV2：多模態智能體如何實現工具協同與動態推理？

社區頭條

隨著人工智能技術的不斷發展，多模態模型逐漸成為研究熱點。小紅書團隊推出的DeepEyesV2，作為一款具有智能體特性的多模態模型，不僅繼承了前代在視覺推理上的優勢，還通過多工具協同實現了從“看圖思考”到“解決問題”的跨越。一、項目概述DeepEyesV2是一個由小紅書團隊開發的多模態智能體模型，旨在通過整合代碼執行、網頁搜索和圖像操作等多種工具，實現對復雜問題的主動解決。該模型通過兩階段訓練法，即冷啟動階段和強化...

3天前 254瀏覽 0點贊 0回復 0收藏

Step-Audio-EditX：用大語言模型“雕琢”聲音，開啟音頻編輯新視界！

社區頭條

在人工智能技術飛速發展的今天，音頻處理領域也迎來了重大突破。StepAudioEditX作為全球首個開源的LLM音頻編輯大模型，憑借其強大的功能和創新的技術架構，為音頻創作和編輯帶來了全新的可能性。一、項目概述StepAudioEditX是由階躍星辰開發的開源音頻編輯大模型，它基于3B參數的LLM架構，專注于音頻的情感、說話風格和副語言編輯。該模型不僅支持零樣本TTS（文本到語音合成），還能夠通過迭代編輯實現情感和風格的細粒度控制。...

2025-11-12 00:20:05 1761瀏覽 0點贊 0回復 0收藏

別“機械音”：Maya1讓AI語音也能觸動你的心弦

在人工智能領域，語音合成技術一直是研究熱點之一。如今，MayaResearch團隊推出了一款開源的AI語音合成模型——Maya1。它專為生成富有情感的語音而設計，通過自然語言描述來定義聲音特征，支持多種情緒表達，為語音交互帶來了全新的體驗。一、項目概述Maya1是一個開源的AI語音合成模型，基于30億參數的Transformer架構和SNAC神經編解碼器，能夠通過自然語言描述生成具有特定情感和特征的語音。它支持20多種情緒表達，如大笑、哭...

2025-11-12 00:19:21 583瀏覽 0點贊 0回復 0收藏

Uniworld：北大聯合兔展智能打造的AI圖像編輯界的“全能選手”

精華

在人工智能領域，多模態大模型的快速發展為圖像生成與編輯帶來了新的機遇。UniWorld作為這一領域的前沿成果，由北京大學與兔展智能聯合推出，旨在通過創新的模型架構和訓練方法，實現高效、精準的圖像編輯與生成。一、項目概述UniWorld是一個專注于圖像編輯與生成的多模態大模型，其核心目標是通過統一的架構實現圖像理解、生成、編輯和感知等多任務處理。該模型在圖像編輯領域引入了強化學習策略優化，解決了傳統監督微調方法...

2025-11-12 00:19:04 376瀏覽 0點贊 0回復 0收藏

Ling-1T：萬億參數的高效推理非思考模型

在人工智能領域，語言模型的發展日新月異，參數規模的不斷擴大為模型的性能提升帶來了新的機遇與挑戰。今天，我們將聚焦于由螞蟻集團開源的Ling1T模型，它作為Ling2.0系列的第一款旗艦非思考模型，憑借萬億參數的龐大體量和卓越的高效推理能力，為自然語言處理領域帶來了新的突破。一、項目概述Ling1T是基于Ling2.0架構的萬億參數非思考模型，其設計目標是實現高效的推理和強大的認知能力。該模型在20T+token的高質量、高推理濃...

2025-11-03 06:13:50 687瀏覽 0點贊 0回復 0收藏

DeepSeek-OCR：開啟OCR 2.0時代，智能文檔處理新標桿

在數字化轉型的浪潮中，文檔處理一直是企業和研究者面臨的重要挑戰之一。傳統OCR技術雖然能夠識別文本，但在處理復雜文檔、多語言內容以及大規模數據時存在諸多局限。最近DeepSeek團隊開源了DeepSeekOCR模型，這一創新的視覺語言模型通過“上下文光學壓縮”技術，為文檔處理帶來了全新的解決方案。一、項目概述DeepSeekOCR是由DeepSeek團隊開發的一款革命性的OCR模型，參數規模約30億（3B），采用“上下文光學壓縮”技術，將文...

2025-11-03 06:12:46 2444瀏覽 0點贊 0回復 0收藏

OpenLens AI：清華推出的醫學研究全自主AI助手，開啟科研新紀元

在醫學研究領域，隨著數據量的爆炸式增長和研究復雜性的不斷提高，傳統的研究方式面臨著諸多挑戰。研究人員需要花費大量時間在文獻調研、實驗設計、數據分析等繁瑣的流程上，這極大地限制了科研效率和創新速度。為了解決這一問題，清華大學自動化系推出了一款名為OpenLensAI的全自主人工智能研究助手，它能夠模擬人類研究員的工作流程，實現醫學研究全流程的自動化，為醫學研究帶來了一場深刻的變革。一、項目概述OpenLensAI是...

2025-10-21 00:43:59 1828瀏覽 0點贊 0回復 0收藏

語音技術新突破：Ming-UniAudio 一模多能，理解生成編輯全搞定！

在人工智能領域，語音處理技術一直是研究的熱點之一。隨著大語言模型（LLM）的快速發展，語音語言模型在語音理解、生成和編輯等方面取得了顯著進展。然而，現有的大多數語音模型要么將理解與生成任務的表示分離，要么采用離散化表示，導致語音細節損失。為了解決這些問題，螞蟻集團推出了MingUniAudio，這是一個基于統一連續分詞器的語音大模型，能夠同時處理語音理解、生成和編輯任務。一、項目概述MingUniAudio是螞蟻集團開源...

2025-10-21 00:41:38 3708瀏覽 0點贊 0回復 0收藏

10分鐘搞定PPT！ALLWEONE開源Presentation-AI，一鍵生成+智能配圖，打工人直接下班

社區頭條

在當今快節奏的工作與學習環境中，制作演示文稿是一項頻繁且重要的任務。然而，傳統的PPT制作方式往往耗時費力，需要反復構思內容框架、設計頁面布局、尋找合適的配圖等。PresentationAI的出現，為這一痛點提供了全新的解決方案。它通過AI技術，能夠快速生成高質量的演示文稿，極大地提高了工作效率，讓使用者可以將更多精力投入到核心內容的創作與演講本身中。一、項目概述PresentationAI是由ALLWEONE團隊推出的一款開源AI演示...

2025-10-11 06:42:20 4944瀏覽 0點贊 0回復 0收藏

Qwen3Guard：阿里云通義千問團隊推出的安全防護模型

社區頭條

在人工智能快速發展的今天，大語言模型的安全性問題日益受到關注。為了確保模型輸出內容的安全性和可靠性，阿里云通義千問團隊推出了Qwen3Guard，一款專為安全防護設計的護欄模型。它基于強大的Qwen3基礎架構打造，能夠高效識別用戶輸入提示和模型生成回復中的潛在風險，為人工智能交互提供精準、可靠的安全保障。一、項目概述Qwen3Guard是阿里云通義千問團隊推出的安全防護模型，旨在為Qwen系列大語言模型提供全面的安全保障。...

2025-10-10 07:08:57 3552瀏覽 0點贊 0回復 0收藏

谷歌放大招！EmbeddingGemma 免費商用：200MB 內存搞定 100 種語言 RAG，性能翻倍

在當今數字化時代，人工智能技術正以前所未有的速度發展，其中文本嵌入模型作為自然語言處理領域的核心技術之一，扮演著至關重要的角色。谷歌作為人工智能領域的領軍者，近期開源了一款名為EmbeddingGemma的文本嵌入模型，它專為移動端等日常設備設計，具有輕量化、高性能、多語言支持等諸多優勢，有望在眾多應用場景中大放異彩。一、項目概述EmbeddingGemma是一款基于Gemma3架構的3.08億參數多語言文本嵌入模型，專為在手機、...

2025-09-15 07:58:45 3502瀏覽 0點贊 0回復 0收藏

Apertus：瑞士首個開源大模型，多語言支持，合規訓練，高效性能

社區頭條

在人工智能領域，開源大模型的出現為全球開發者和研究人員帶來了新的機遇。瑞士近日正式推出了其首個完全開源的大語言模型——Apertus。這一模型由瑞士聯邦理工學院（EPFL）、蘇黎世聯邦理工學院（ETHZurich）和瑞士國家超級計算中心（CSCS）聯合研發，旨在推動透明、開放且合規的AI發展。。一、項目概述Apertus是瑞士首個大規模開放的大型語言模型（LLM），具有多語言處理能力，覆蓋了超過1000種語言，其中40%的數據來自非英語...

2025-09-15 07:58:08 2577瀏覽 0點贊 0回復 0收藏

分層反思+ 主動探索 = SOTA：MobileUse 在 AndroidWorld 刷出 62.9% 新紀錄

隨著人工智能技術的飛速發展，多模態大語言模型（MLLMs）在理解視覺輸入和遵循用戶指令方面取得了顯著進展。這為移動設備上的復雜任務自動化帶來了新的可能性。然而，將這些模型應用于現實世界的移動場景仍面臨諸多挑戰，例如長時任務執行、錯誤恢復困難以及在不熟悉環境中啟動時的冷啟動問題。為了解決這些挑戰，MadeAgents團隊推出了MobileUse項目，旨在通過分層反思架構和主動探索模塊，實現移動設備上的魯棒性和自適應任務...

2025-09-01 00:05:49 2352瀏覽 0點贊 0回復 0收藏

手敲命令Out了！Chaterm語音識別+AI Agent，運維會議現場演示嗨翻全場

在云計算和開發運維（DevOps）日益普及的今天，運維人員和開發人員常常需要在復雜的命令行環境中進行操作，這不僅效率低下，還容易出錯。為了改善這一現狀，Chaterm應運而生。一、項目概述Chaterm是一款開源的智能、安全的AI終端工具，由一群DevOps專家開發，專為云從業者和開發運維人員設計。它基于AIAgent，讓用戶能夠用自然語言代替復雜的命令行操作，提供基于個人知識庫的智能補全功能，支持高精度語音命令輸入，具備跨平臺...

2025-09-01 00:05:17 1365瀏覽 0點贊 0回復 0收藏

阿里達摩院偷偷放大招！RynnEC讓機器人“看懂世界”只需一句話

隨著人工智能技術的飛速發展，具身智能成為了當前研究的熱點領域之一。具身智能強調智能體通過身體與環境的交互來實現對世界的理解和任務執行。在這一背景下，阿里達摩院推出了RynnEC世界理解模型，為具身智能的發展注入了新的動力。一、項目概述RynnEC是阿里巴巴達摩院推出的一款專為具身認知任務設計的視頻多模態大語言模型（MLLM）。它能夠從位置、功能、數量等11個維度全面解析場景中的物體，支持物體理解、空間理解以及視...

2025-09-01 00:04:27 2276瀏覽 0點贊 0回復 0收藏

別再人工翻文檔了！騰訊開源WeKnora，一鍵搞定“語義搜索+精準問答”，效率翻 10 倍

在當今數字化時代，企業與研究機構面臨著海量文檔數據的管理和利用挑戰。如何高效地解析、檢索并理解這些文檔內容，成為提升工作效率和知識傳遞的關鍵。騰訊開源的WeKnora項目，憑借其強大的文檔理解與語義檢索能力，為企業和科研人員提供了一種全新的解決方案。一、項目概述（??WeKnora是什么？）WeKnora是騰訊開源的基于大語言模型（LLM）的文檔理解與語義檢索框架。它采用模塊化設計，支持多模態文檔解析（如PDF、Word、圖片...

2025-08-19 07:17:00 8423瀏覽 0點贊 0回復 0收藏

KittenTTS ：不用 GPU、不聯網！8 種真人音色隨選隨播，輕到離譜（僅25MB）

在人工智能技術飛速發展的今天，文本轉語音（TTS）技術已經廣泛應用于各個領域，從智能語音助手到教育工具，再到輔助技術等。然而，傳統的TTS模型往往體積龐大，依賴高性能硬件和網絡連接，限制了其在資源受限環境中的應用。KittenML團隊推出的KittenTTS項目，以其輕量化設計和強大的離線運行能力，為這一問題提供了全新的解決方案，為開發者和用戶帶來了新的選擇。一、項目概述（??KittenTTS是什么？）KittenTTS是由KittenML團...

2025-08-19 07:13:12 1.1w瀏覽 0點贊 0回復 0收藏

獲得成就

已積累 6.0w 人氣

獲得 1 個點贊

獲得 1 次收藏