豆包是字節跳動推出的多功能人工智能助手,采用“智能助手+場景化工具”模式,覆蓋日常生活、學習、辦公等場景,核心是通過AI技術提供個性化服務,提供聊天機器人、寫作助手以及英語學習助手等功能,可以回答各種問題并進行對話,幫助人們獲取信息。豆包有網頁版、iOS版、安卓版、Windows桌面版、Mac OS桌面版,支持手機號碼、抖音、以及蘋果公司賬號登錄。
2016年,字節跳動就成立了人工智能實驗室AI Lab。2023年6月左右,字節跳動在內部測試一款AI對話類產品——Grace。2023年8月,Grace新版本更名為“豆包”,并開始啟動測試。2024年6月3日,豆包推出桌面客戶端,支持Windows/macOS,快捷啟動、AI劃詞、AI搜索。同年8月8日,豆包上線音樂生成功能。同年8月16日起,豆包推出腦圖功能。同年8月30日,豆包輸入框新增語音輸入和圖片上傳入口。同年9月6日,豆包輸入框新增“停止生成”按鈕。同年10月10日,豆包發布了首款AI智能體耳機Ola Friend,該款耳機接入豆包大模型,并與豆包APP深度結合。同年10月28日,語音通話功能上線,支持回復實時信息。同年11月,豆包正式推出視頻生成內測。
2025年1月20日,豆包發布最新“端到端”語音大模型,并基于該模型升級App的實時語音通話功能。此前功能采用ASR(語音識別)+LLM(大語言模型)+TTS(語音合成)的級聯方案,此次升級將語音識別、理解與生成整合至同一模型,實現更自然流暢、富有情感的語音交互,并支持回復實時信息。2025年2月,豆包優化了首頁的布局和交互邏輯,為用戶提供更加簡潔流暢的使用體驗。同年3月4日,豆包大模型團隊宣布開源SuperGPQA。同年3月,抖音App測試接入豆包App的AI能力,并且在抖音App內為豆包App開放了兩個超級入口。同年3月,豆包測試新版“深度思考”功能。同年4月,豆包深度思考和文生圖3.0模型已通過火山引擎正式開放API,供開發者和企業客戶使用。同年5月23日,豆包宣布在App端上線實時視頻通話功能。同年6月,豆包電腦版全量上線AI播客功能。同年6月30日,豆包“深入研究”功能在豆包App、網頁端、電腦版正式開啟測試,用戶可免費體驗。同年7月30日,火山引擎宣布,豆包·圖像編輯模型SeedEdit 3.0正式登陸火山方舟。12月1日,字節跳動豆包團隊發布豆包手機助手技術預覽版。2025年12月18日,豆包大模型1.8(Doubao-Seed-1.8)正式發布,在視覺推理、通用視覺問答、空間理解及視頻理解等任務中,均獲得最佳或接近最佳成績;在通用智能體測評集BrowserComp上表現全球領先;在數學與推理等基礎能力維度上,整體水平已接近全球頂尖的通用模型。2026年2月,豆包視頻生成模型Seedance2.0上線。2月14日,豆包大模型2.0正式發布。
截至2024年11月底,豆包APP的累計用戶規模超過1.6億。截至2025年3月底,豆包大模型日均調用量已達到12.7萬億次。2025年4月,豆包在華爾街見聞2024Smart Future·AI應用標桿評選活動中獲評卓越人工智能產品獎。據QuestMobile發布的2025年8月移動互聯網數據顯示,豆包月活躍用戶規模達1.5742億,在中國AI應用產品中居第一位。2025年12月24日報道,豆包的日均活躍用戶數(DAU)已突破1億大關。
發展歷程
2016年,字節跳動就成立了人工智能實驗室AI Lab,聚焦于自然語言處理、機器學習、數據挖掘等方面的研究。2023年6月左右,字節跳動在內部測試一款AI對話類產品,暫時稱作“Grace”,該產品處于測試完善的階段。
2023年8月,字節跳動旗下AI對話產品Grace推出新版本并更名為“豆包”,同步啟動測試。該版本支持手機號碼、抖音賬號及蘋果公司賬號登錄,用戶可通過對話形式使用生成歌詞、小說、文案等文本內容的功能。除文字回答外,每段回答還配備數字人“豆包”的語音播報。產品應用圖標采用留短發波波頭的女性卡通擬人化形象設計,用戶首次打開應用時,該形象會主動觸發打招呼交互,形成親切的用戶體驗。
2024年5月,2024春季火山引擎Force原動力大會上,字節跳動產品和戰略副總裁朱駿表示,豆包App總下載量已達1億次。豆包大模型將開啟商業化,價格相比同行便宜99.3%,定價0.0008元/千Tokens。大模型的“token”是指在自然語言處理任務中,模型所使用的輸入數據的最小單元。這些token可以是單詞、子詞或字符等。同年6月3日,豆包推出桌面客戶端,支持Windows/Mac OS,快捷啟動、AI劃詞、AI搜索。同年8月8日,豆包上線音樂生成功能,提供民俗音樂、嘻哈、R&B等11種音樂風格(包括架子鼓、雷鬼、電子音樂等小眾曲風),用戶可選擇男聲或女聲演唱,輸入主題或歌詞,設定情緒及音色,便能快速生成一首約1分鐘的詞曲,支持一鍵分享至抖音等社交平臺。同年8月16日起,豆包推出腦圖功能,在上傳文件時,可選擇“生成腦圖”功能,可快速梳理文檔,一鍵理清思考框架。同年8月30日,豆包輸入框新增語音輸入和圖片上傳入口。同年9月,2024火山引擎AI創新巡展上,火山引擎總裁譚待宣布推出豆包·視頻生成模型。兩款新發布的大模型分別是,豆包視頻生成-PixelDance和豆包視頻生成-Seaweed,這兩款大模型的發布,意味著字節跳動首次正式宣告進軍AI視頻生成。同年9月6日,豆包輸入框新增“停止生成”按鈕。
2024年10月10日,字節跳動豆包發布了首款AI智能體耳機Ola Friend,該款耳機接入豆包大模型,并與豆包APP深度結合。用戶戴上耳機后,無需打開手機,便能通過語音喚起豆包進行對話。同年10月28日,語音通話功能上線,支持回復實時信息。同年11月,豆包正式推出視頻生成內測,支持圖片文字一鍵成片、動態運鏡和多鏡頭一致性、風格比例隨意挑選。2024年12月,豆包于App及PC端全面上線圖片理解功能,用戶通過界面上的照片或相機按鈕上傳圖片后,豆包可識別圖片中的各類元素和基本特征。截至12月18日,豆包大模型日均tokens使用量超過4萬億。
2025年1月,豆包大語音模型成為首家“引領級”通過中國信通院語音大模型能力評估的模型。此外,該模型構建了自主的數據生產體系,未采用其他模型的蒸餾數據以保障數據來源的獨立性與可靠性,并通過梯度篩選和迭代過濾技術優化數據使用,實現用25%的數據達到近似全量數據的訓練效果。2025年1月20日,豆包App更新實時語音通話功能,面向所有用戶開放,該功能基于最新豆包實時語音大模型(Doubao Realtime Voice Model)。同年2月,豆包優化了首頁的布局和交互邏輯,為用戶提供更加簡潔流暢的使用體驗。同年3月4日,豆包大模型團隊宣布開源SuperGPQA,一個領域全面且具備高區分度的知識推理基準測試。該數據集構建了覆蓋285個研究生級學科、包含26529道專業問題的評估體系,不僅涵蓋主流學科,更將輕工業、農業、服務科學等長尾學科納入其中,展現出全面學科的覆蓋廣度,填補了長尾知識評估領域的空白。同年3月,抖音App測試接入豆包App的AI能力,并且在抖音App內為豆包App開放了兩個超級入口,一個位于短視頻界面,與點贊、評論、轉發等功能處于同一豎列;另外一個入口則位于抖音App的消息列表內。對此,抖音相關負責人表示,相關能力測試中,主要是希望為用戶提供更豐富的AI服務。同年3月12日,豆包大模型團隊正式發布文生圖技術報告,首次公開Seedream 2.0圖像生成模型技術細節,覆蓋數據構建、預訓練框架、后訓練RLHF全流程。同年3月,豆包測試新版“深度思考”功能,該功能將推理過程的思維鏈與搜索深度結合,支持“邊想邊搜”;豆包在思考過程中可串聯信息、歸納重點,快速讀懂網頁、拆解論文、提煉報告,提供細致全面的結果。
2025年4月,豆包深度思考和文生圖3.0模型已通過火山引擎正式開放API,供開發者和企業客戶使用。同年4月,字節跳動推出文本生成圖像模型Seedream 3.0,文生圖跑分超GPT-4o,字節跳動計劃未來將Seedream3.0集成至“豆包”。同年4月,字節AI產品部門Flow旗下發生產品調整:社交陪伴類AI產品貓箱原負責人梁琛奇已離開字節跳動;貓箱負責人由原星繪產品負責人西原(花名)接任;同時,星繪團隊計劃并入豆包,將由豆包App端負責人陸游(花名)一起管理。
2025年5月23日,豆包宣布在App端上線實時視頻通話功能,用戶在“打電話”界面點擊視頻按鈕即可開啟視頻通話,豆包可獲取用戶攝像頭拍攝的實時畫面,支持基于真實場景與用戶進行實時問答互動。該功能基于最新的豆包視覺理解模型,該模型具備多模態信息融合處理、復雜任務處理及實時聯網檢索三大能力,擁有較好的內容識別、理解推理和內容描述能力,能夠融合視覺與語言輸入進行綜合深度思考和創作,可完成解微積分題、分析論文圖表、診斷真實代碼問題等復雜邏輯計算任務。其應用場景具體豐富,如在文化旅游中,可為用戶講解故宮太和殿的歷史沿革、古埃及羅塞塔石碑的文化意義;教育學習時,能解析數學錯題的解題思路、輔助理解物理實驗圖表;辦公場景下,可智能處理合同文檔的關鍵信息提取;生活里,能識別水果成熟度、推薦契合用戶興趣的書籍等。通過優化架構,豆包的平均響應延遲控制在800毫秒以內,交互流暢度接近自然對話;技術團隊還實現了“情境保持”能力,可在連續視頻流中持續跟蹤對話主題(例如用戶突然提問“剛才看到的蔡磊的書在哪里”,豆包仍能準確回溯并解答)。為提升對話準確性與時效性,該功能還接入了聯網搜索能力,支持實時獲取互聯網最新信息。同年6月,豆包電腦版全量上線AI播客功能,用戶上傳PDF或網頁鏈接后,可一鍵生成雙人對話的播客節目,有參與內測的用戶表示,會將一些較長的學習資料發給豆包,一鍵轉成語音,AI播客生成的對話在音色上十分接近真人,甚至停頓、語氣詞等細節都與日常講話無異,有效去除了生硬的機器感。同月11日,字節跳動旗下火山引擎舉辦Force原動力大會,發布豆包大模型1.6、視頻生成模型Seedance1.0 pro等新模型,并升級了Agent開發平臺等AI云原生服務,豆包1.6模型披露多項權威測評成績。其中,豆包大模型1.6披露多項權威測評成績,該模型引入自適應思考技術,可根據任務難度自動啟用深度推理,在保證處理效果的同時減少token消耗,進而降低使用成本。在復雜推理、競賽級數學、多輪對話和指令遵循等測試集上,豆包1.6-thinking的表現已躋身全球前列。同年6月30日,豆包“深入研究”功能在豆包App、網頁端、電腦版正式開啟測試,用戶可免費體驗。同年7月30日,火山引擎宣布,豆包·圖像編輯模型SeedEdit 3.0正式登陸火山方舟。
2025年12月1日,字節跳動豆包團隊發布豆包手機助手技術預覽版。這是豆包和手機廠商在操作系統層面合作的手機AI助手。基于豆包大模型的能力和手機廠商的授權,豆包手機助手能夠為用戶帶來更方便的交互和更豐富的體驗。隨后,針對使用過程中出現的問題,豆包手機助手團隊于2025年12月5日發布調整說明,對AI操作手機能力進行規范化調整,重點限制刷分刷激勵、金融類使用及游戲類使用場景,暫時下線金融類應用操作能力,并積極與應用廠商溝通以制定安全行為準則。
2026年2月10日,豆包官宣要上中央電視臺春節聯歡晚會發10萬份科技好禮,還可領取現金紅包。2月12日,豆包宣布,豆包視頻生成模型Seedance 2.0正式接入豆包App、電腦端和網頁版。2月14日,豆包大模型2.0正式發布。豆包2.0(Doubao-Seed-2.0)圍繞大規模生產環境下的使用需求做了系統性優化。豆包2.0系列包含Pro、Lite、Mini三款通用Agent模型和Code模型,靈活適配各類業務場景:豆包2.0 Pro面向深度推理與長鏈路任務執行場景,全面對標GPT 5.2與Gemini 3 Pro;2.0 Lite兼顧性能與成本,綜合能力超越上一代主力模型豆包1.8;2.0 Mini面向低時延、高并發與成本敏感場景;Code版(Doubao-Seed-2.0-Code)專為編程場景打造,與TRAE結合使用效果更佳。
功能和服務
豆包具有多項實用功能,涵蓋聊天機器人、寫作助手、英語學習助手等類型,可通過問答和對話形式輔助信息獲取。該對象具備多模態融合的交互能力,支持文本、圖像、語音、視頻等多模態交互形式;文生圖功能可生成高分辨率圖片,并依托字節生態(如短視頻平臺、飛書等)實現素材同步與應用閉環。此外,豆包還集成了AI云盤、生成視頻、拍題答疑、制作PPT、健康咨詢、網頁瀏覽以及數據分析等功能。在未成年人模式設置方面,需由家長通過指定路徑手動開啟并設置獨立密碼,退出或切換模式時需二次輸入密碼確認,以防止未成年人自行關閉或繞過設置。該模式下,回答展示視頻、瀏覽第三方網頁、與豆包以外的智能體對話及AI創作等功能默認關閉,而翻譯、資料查詢與深入研究等學習與工作相關功能仍可正常使用。
智能對話
豆包AI具備自然語言理解與解析能力,其功能實現依托大模型算法。該算法通過深度神經網絡、強化學習等技術訓練,核心采用基于Transformer架構的語言模型。用戶可通過語音或文字輸入問題,豆包AI能夠以自然流暢、邏輯清晰的文本形式進行交流回復。豆包具備強大的語言理解能力,支持理解和處理中文、英文、日語等多種自然語言,可實現跨語言溝通;同時具備高效翻譯功能,支持30余種語言間的互譯服務,具備較高的翻譯質量和較快的翻譯速度,可輔助國際交流的順暢開展。豆包AI儲備了眾多領域的知識,可以為用戶提供準確有用的信息。
此外,豆包具備記憶功能,能夠記錄用戶對話細節及偏好(含用戶主動要求記憶的內容),并將這些信息作為背景數據用于生成更具相關性的定制化回復。記憶功能通過對話滾動刷新機制實現智能管理,具體涵蓋記憶更新、整合及按用戶指令刪除等操作,記憶內容提取自對話文本(不包含用戶上傳的圖片、文件、鏈接)。用戶可通過設置頁面的記憶開關控制該功能的開啟或關閉,關閉聊天或刪除聊天記錄不會清除已存儲記憶,但可通過「豆包設置-記憶-刪除記憶」路徑主動刪除;也能在聊天過程中直接指令豆包遺忘特定信息(示例:“請忘記我喜歡周杰倫的音樂”)。該記憶功能支持實時語音聊天、離線消息處理、佩戴Olafriend耳機聊天等應用場景,并依托云端向量庫與用戶畫像融合技術實現跨會話記憶能力。
AI生圖
用戶提供生成圖像內容的關鍵詞或對圖像場景進行描述,可以對圖像的風格進行指定,如水墨畫、卡通圖等,還可以指定圖像中各元素的具體要求,如顏色、形狀、構圖等。豆包AI可基于用戶提供的信息生成相關圖像,同時支持圖片加字、修改等創意編輯操作,此外,豆包的文生圖模型3.0具備2K分辨率圖片生成、文字排版優化及實拍級圖像生成能力,在文生圖領域權威榜單中躋身全球第一梯隊,應用場景涵蓋影視、電子商務設計等領域,能夠滿足用戶的創意表達需求。
智能寫作
豆包AI可以根據關鍵詞幫用戶寫各類文案,可以按用戶指定的寫作類型和需求撰寫不同風格的文章,用戶還可以提出寫作要求如風格、文章長度及語言等。它還可以潤色完善已有文本,提煉總結文字內容,滿足用戶在寫作方面的多種要求。
音樂生成
豆包AI的音樂生成功能,能夠幫助用戶在無需精通樂理知識的情況下創作個人音樂作品,用戶只需描述所需的音樂風格、情緒氛圍及主題思想,豆包即可生成匹配描述的旋律與歌詞。
錄音紀要
豆包AI的錄音紀要功能能夠將錄音中的語音轉換成文字形式方便用戶查看和編輯。它能夠自動分析錄音內容,提取出比如會議的主題、討論的要點、時間節點等關鍵信息,以清晰的結構呈現給用戶。
PPT大綱生成
當用戶輸入主題或內容要求時,豆包AI可生成條理清晰、邏輯連貫、結構合理的PPT大綱,為用戶設計PPT提供思路。依托智能內容生成與模板適配技術,該功能可將傳統需數小時完成的PPT制作流程縮短至10分鐘內,適用于緊急匯報、課程展示等場景。
文檔閱讀
用戶可以將Word文檔、PDF文件或是其他格式的文件上傳給豆包AI,它可以對文檔進行閱讀并快速分析文檔。比如上傳一篇論文,豆包可以快速提取出論文的研究背景、目的、方法、結論,幫助用戶了解論文的核心內容。
網頁閱讀
用戶只需將網頁的鏈接交給豆包AI,它可以對這個網頁的內容進行分析提取關鍵信息,如網頁中的重要文本、數據、圖表等,并進行總結分析。
深入研究
選擇“深入研究”,輸入詳細指令或一句話prompt,等待幾分鐘,即可生成一份報告。使用豆包App生成報告后,還可以打開報告內容,選擇右上角“聽”按鈕,一鍵轉成播客,隨時聽。
生成腦圖
在上傳文件時,用戶可以選擇“生成腦圖”功能,快速梳理文檔,一鍵理清思考框架。
數據分析
數據分析可一鍵實現數據合并去重、格式轉換、數據分析以及圖表繪制等操作,讓數據工作變得更簡單。
語音通話
2024年,豆包推出實時語音通話功能,部分用戶使用該功能進行英語口語練習、樹洞閑聊等場景;2025年1月20日,豆包App更新實時語音通話功能并面向全體用戶開放;2025年1月22日,豆包APP宣布推出該實時語音通話功能。該功能在語音表現力、情緒承接、對話流暢度及情感表達等方面實現了提升。此外,豆包具備聲音克隆功能,用戶通過錄制30秒含平仄變化的語音樣本,系統可提取基頻、共振峰等200余項聲學參數生成聲紋特征,最終生成與用戶自身聲線高度相似的克隆語音(安靜環境下自然度評分為4.2分,滿分5分)。體驗豆包AI語音功能的步驟為:打開豆包APP,選擇默認智能體,點擊右上角電話圖標,即可進行一對一語音閑聊。此外,在電腦上可通過語音通話功能與豆包語音對話,點擊首頁輸入框右側入口即可開啟。通話過程中,豆包支持實時聯網搜索信息以提升回答準確性,同時具備方言與英語對話、多角色模仿等功能,交互表現具有類人特征,其中,方言對話功能支持粵語、四川話、東北話、陜西話4種地道方言,通過方言遷移技術實現單音色多方言表達,并可根據用戶意圖靈活切換方言,實現了從“工具型語音助手”到“情感化交互伙伴”的升級,可提供高效、自然的語音交互體驗。其大模型流式語音識別技術在輸入格式上支持PCM、OPUS格式音頻(要求為單聲道且采樣率為16000Hz),接入方式包括Websocket API和在線SDK,為語音輸入法等實時交互場景提供技術支撐。此外,語音通話中還含有“靈魂歌手”模式,可讓豆包演唱如Taylor Swift的《Love Story》等作品,也能按用戶指令生成含特定歌詞的歌曲,其曾在火山引擎發布會上現場演唱《月亮代表我的心》,能把控節奏、兒化音等細節。此外,豆包的唱歌功能已延伸至音樂創作領域,支持克隆歌手聲線演唱原創歌曲,可應用于自然、沉浸的語音交互場景。
2025年1月20日,豆包App更新實時語音通話功能,面向所有用戶開放。該功能基于最新豆包實時語音大模型(Doubao Realtime Voice Model)。更新后,豆包中文場景的對話能力在語音真實感和“喜怒哀樂”的情緒表現上近乎達到“人機難辨”的AI交互效果,可以模仿不同聲線,并且在“邏輯思考”和“情緒感知”上有明顯提升。
視頻通話
豆包支持在電話界面開啟視頻畫面后,基于真實場景開展實時問答互動。該功能基于火山引擎RTC實時音視頻技術實現,具備毫秒級低延遲傳輸及抗弱網能力,依托其視覺理解模型,能夠融合視覺與語言輸入進行綜合深度思考和創作,支持解微積分題、分析論文圖表、診斷代碼問題等復雜邏輯計算任務,具備聯網搜索能力,可實時獲取互聯網信息。在隱私保護方面,豆包采用"視覺聚焦"技術,僅分析畫面中心區域,原始數據不上傳云端,以此保障用戶信息安全。此外,該功能具備智能語義判停和聲紋降噪能力,在咖啡店、商場等嘈雜環境中可精準識別用戶聲音,交互表現趨近于真人對話。其應用場景涵蓋公園花草識別、博物館實時講解等具體場景;此外,豆包具備識別雜亂擺放物品并記憶其位置的能力,用戶移動后仍可回憶此前鏡頭中短暫出現的物品信息,體現出持續記憶與邏輯推理能力。
AI播客
豆包AI播客功能基于豆包大模型團隊推出的語音播客模型開發,工作時,用戶可以將行業報告或競品分析鏈接(也可用PDF文檔或網頁鏈接)發給豆包,一鍵生成內容豐富、語音自然、通俗易懂的播客節目,隨時隨地用耳朵獲取信息。截至2025年6月,該功能已在扣子空間、豆包電腦版上線,豆包APP已開啟小流量測試,計劃全量上線。
AI編程
豆包的電腦版和網頁版AI編程功能支持多文件上傳、GitHub倉庫引入、新代碼編輯器等,并提供編程自學輔助。同時擁有可視化編輯功能(即“應用創造1.0”),可讓通過“AI編程”生成的網頁應用在預覽界面直接進行文字編輯、智能換圖,還能精準選中局部元素進行調整,讓零編程基礎的用戶也能搭建應用,類似修改PPT內容。2025年3月19日,豆包的“AI編程”功能迎來三項升級,分別為HTML預覽、Python運行及生成完整項目。其中,HTML預覽功能支持代碼實時預覽與交互,可更直觀地制作各類小游戲和網頁;Python運行功能支持代碼直接運行,報錯時可通過一鍵AI修復功能解決;生成完整項目功能則支持直接生成完整項目代碼,無需分別生成前后端邏輯后再復制粘貼。
手機AI助手
手機AI助手領域呈現“手機廠商+大模型廠商”深度合作的發展趨勢,該模式需平衡隱私安全、權限合規及與超級應用的生態協同等多重挑戰。豆包手機助手是基于豆包App,與手機廠商在操作系統層面合作開發的AI助手軟件。基于豆包大模型的能力和手機廠商的授權,豆包手機助手能夠為用戶帶來更方便的交互。在豆包手機助手發布的技術預覽版演示視頻中可以看到,用戶可通過語音、側邊鍵或豆包Ola Friend耳機直接喚醒豆包。在任意界面使用手機時,用戶都可以直接就屏幕內容向豆包手機助手提問以獲取更多信息。同時,豆包手機助手也將語音通話、視頻通話和屏幕共享等豆包用戶常用功能嵌入助手中。另外,豆包手機助手具備AI操作手機功能,可根據用戶指令在多款應用間自動跳轉,執行查票訂票、商品下單等任務。該功能需調用安卓系統級高危權限(如INJECT_EVENTS),此類權限原設計用途為輔助視障人群操作設備。當該權限被用于商品比價、自動領券下單等場景時,可能被微信、銀行類應用識別為“非真人操作”,觸發應用內置的安全風控機制,進而導致賬號強制退出或凍結。然而,由于APP端與AI助手在操作權限判定標準上存在差異,互聯網平臺現有安全規則與AI助手跨應用自動化操作功能產生沖突,最終引發多家應用采取限制措施。
視頻生成
Seedance2.0是由字節跳動推出的AI視頻生成模型,可根據文本或圖像創建電影級視頻。
Seedance2.0支持文本生成視頻、圖片生成視頻及視頻和音頻參考素材輸入,可根據描述情節自動規劃分鏡和運鏡。模型采用雙分支擴散變換器架構,可同時生成視頻和音頻。只需編寫詳細的提示或上傳一張圖片,Seedance2.0即可在60秒內生成帶有原生音頻的多鏡頭序列視頻。其獨有的多鏡頭敘事功能,能夠根據單個提示自動生成多個相互關聯的場景。AI會自動保持所有場景切換中角色、視覺風格和氛圍的一致性,無需手動編輯。
2026年2月7日,Seedance2.0開始小范圍內測。2月11日,豆包內已開啟Seedance2.0的灰度測試。2月12日,Seedance2.0正式接入豆包App、電腦端和網頁版。
合作交流
2025年2月,路特斯汽車中國官方宣布,豆包AI助手將上車,宣稱“原生能力深度融合”。2025年3月,金科娛樂接受機構調研時表示,在底層模型上,湯姆貓AI情感陪伴機器人產品采用MoE(混合專家模型)架構,搭載了公司與西湖心辰定制的“湯姆貓情感陪伴垂直模型”,同時也調用了豆包、DeepSeek等模型的部分能力,有效增強了產品的意圖識別、響應速度、數學能力等功能。2025年8月1日,小米瀏覽器對“AI搜索”功能進行升級,通過接入豆包大模型及火山方舟高代碼智能體產品,提升了AI搜索的效率與服務豐富度。此外,SERES與火山引擎在具身智能和車機系統領域開展合作,豆包已進入其車型研發階段,預計將提升智能座艙用戶體驗。
研發團隊
豆包備案信息為北京春田知韻科技有限公司。天眼查顯示,該公司注冊資本100萬元,法定代表人為嚴林,成立時間2023年7月26日,由北京抖音信息服務有限公司全資持股。經營范圍含計算機系統服務、數據處理服務、軟件開發、數字內容制作服務(不含出版發行)、網絡文化經營等。
字節機器人團隊隸屬于字節AI Lab,其負責人是AI Lab總監李航。李航曾擔任華為諾亞方舟實驗室主任和首席科學家,2017年加入字節,向字節副總裁、算法技術負責人楊震原匯報。
應用平臺
截至2025年7月,豆包支持網頁版、iOS版、安卓版、Windows桌面版、Mac OS桌面版等多平臺使用,其中iOS版需通過TestFlight安裝。豆包網頁版首頁作為用戶進入平臺的主要入口,集成快速訪問、功能導航、個性化服務等核心模塊,整體設計簡潔直觀,兼顧新手操作便利性與使用效率。豆包支持手機號碼、抖音、以及蘋果賬號登錄。
品牌榮譽
社會影響
2024年11月的AI大模型月活躍排行榜上,豆包App以5998萬MAU的成績,穩居全球第二,僅次于OpenAI的ChatGPT,在中國國內排名第一。而它的海外版Cici的MAU也有1267萬,排在第22位。
2024年12月19日,智源研究院發布最新一期大模型綜合及專項評測結果。在覆蓋國內外100余個開源和商業閉源大模型的評測中,豆包通用模型pro獲得大語言模型主觀評測最高分;在多模態模型評測中,豆包視覺理解模型排名視覺語言模型第二,成績僅次于GPT-4o;豆包文生圖模型、豆包視頻生成模型(即夢P2.0 pro)也分別在相應測試中獲得全球第二。
截至2024年11月底,豆包APP的累計用戶規模超過1.6億。截至2025年3月底,豆包大模型日均調用量已達到12.7萬億次。
社會評價
縱觀市面上再能整活的AI,大部分頂多還是在言語上夠犀利。但豆包厲就厲害在,與它對話幾乎毫無違和感,甚至就是有種跟真人聊天的既視感。可以說,豆包的出現,讓AI不再是年輕白領的專屬工具,而是變成老少通殺的電子玩具。(新浪財經 評)
參考資料 >
字節跳動抖音子公司推出 AI 機器人“豆包”,基于云雀模型.IT之家.2023-10-23
字節跳動推出AI對話機器人“豆包” 記者實測體驗!.財聯社.2025-07-30
字節豆包推出桌面客戶端:支持 Windows / macOS,快捷啟動、AI 劃詞、 AI 搜索.IT之家.2025-07-30
豆包.豆包.2025-07-30
字節旗下火山引擎發布AI助手:背靠自研大模型,原生應用仍需時日.今日頭條.2023-10-23
字節正在內部測試對話類AI項目.環球科技.2025-07-30
字節跳動AI對話產品“豆包”上線 回應:仍是小范圍邀請制測試,存在較多局限.百家號.2025-07-30
字節跳動旗下AI助手豆包上線音樂生成功能.百家號.2025-07-30
產品動態.豆包.2025-07-30
字節豆包推出AI智能體耳機Ola Friend 售價1199元.中國新聞網.2024-10-10
字節跳動 AI 助手豆包被曝開啟視頻生成內測.IT之家.2025-07-30
豆包App灰度最新語音模式,實現了GPT-4o不會的唱歌.新浪財經.2025-08-11
285 學科全覆蓋!豆包大模型團隊開源基準測試集 SuperGPQA.字節跳動.2025-07-30
抖音回應接入豆包:相關能力測試中.財聯社.2025-07-30
豆包測試新版深度思考功能 支持邊想邊搜.百家號.2025-07-30
豆包深度思考和文生圖3.0模型開放API.百家號.2025-07-30
豆包上線視頻通話功能:支持實時問答互動,具備視覺理解能力.IT之家.2025-07-30
豆包電腦版上線AI播客功能.百家號.2025-07-30
豆包上線“深入研究”:長途旅行攻略、政策解讀、科技趨勢分析都能處理.IT之家.2025-07-30
豆包圖像編輯模型3.0上線火山方舟.百家號.2025-07-30
無自研手機計劃,豆包發布手機助手技術預覽版.今日頭條-新京報.2025-12-02
豆包手機助手發布技術預覽版.豆包官方.2025-12-02
火山引擎發布豆包大模型1.8,多模態Agent能力進入全球第一梯隊.百家號.2026-01-04
豆包視頻生成模型Seedance 2.0上線.今日頭條.2026-02-12
豆包大模型2.0正式發布.今日頭條.2026-02-14
字節氪金10億的“掌上明珠”,快被全網玩壞了.百家號.2025-07-30
字節發布深度思考模型 具備“看圖思考”能力.新華網.2025-07-30
2024「Smart Future·AI應用標桿」| 評選結果公布.微信公眾號.2025-07-30
豆包月活躍用戶超越deepseek 主管AI的副總裁朱駿本科是學土木的.新浪財經.2025-10-04
QuestMobile 2025年8月AI應用行業月度報告:移動端應用用戶規模達到6.45億,5大類應用、23個賽道廝殺激烈.Quest Mobile.2025-10-04
豆包DAU破億,成字節史上推廣費用最少的破億產品.百家號.2026-02-02
字節跳動:豆包大模型將開啟付費,定價0.0008元/千Tokens.新浪科技.2024-05-15
字節跳動正式宣告進軍AI視頻生成,豆包視頻生成大模型正式發布.百家號.2025-07-30
豆包上線圖片理解功能;阿里簽下蛇年春晚獨家電商平臺|未來商業早參.百家號.2025-09-22
火山引擎發布豆包視覺理解模型!龍頭拿下連續兩個20CM漲停,字節跳動旗下兩大引擎A股合作商名單一覽.今日頭條.2026-02-04
豆包語音大模型首家引領級通過中國信通院語音大模型評估.澎湃新聞.2025-07-30
Doubao-1.5-pro.字節跳動Seed團隊官方博客.2026-01-11
豆包App更新實時語音通話功能.今日頭條.2025-08-16
豆包文生圖技術報告發布.科創板日報.2025-07-30
字節 Seedream 3.0 登場:文生圖跑分超 GPT-4o.百家號.2025-07-30
字節AI產品據悉調整:貓箱負責人離職,星繪并入豆包.數智化發展研究中心.2025-07-30
字節跳動豆包上線視頻通話功能:AI視覺交互開啟“場景伙伴”新時代.今日頭條.2025-08-03
豆包上線視頻通話功能,支持實時視頻問答.今日頭條.2025-08-03
豆包上線視頻通話功能,支持實時視頻問答.今日頭條.2025-08-03
字節跳動豆包上線視頻通話功能:AI視覺交互開啟“場景伙伴”新時代.今日頭條.2025-08-05
使用成本降至三分之一 字節大模型戰略升級.環球網.2025-10-16
火山引擎發布豆包大模型1.6 加速Agent大規模應用.新浪財經.2025-08-19
關于調整AI操作手機能力的說明.微信公眾號.2026-01-09
這個除夕,來豆包抽科技大禮,領現金紅包。.新浪微博-豆包官方.2026-02-11
豆包官宣“要上總臺春晚”,除夕當晚將送出10萬份科技好禮及現金紅包.今日頭條-PConline太平洋科技.2026-02-11
讓桌面上的每一個應用都接入 AI.豆包.2025-08-08
智能助手豆包AI功能介紹基礎部 張靜.西北大學現代學院.2025-07-30
字節Seedream 3.0追平GPT-4o入文生圖第一梯隊!即夢、豆包全量上線,技術報告公開.騰訊網.2025-10-25
豆包上線“深入研究”功能.百家號.2025-07-30
產品簡介.火山引擎.2025-10-17
字節系大模型上新,AI智能體規模化應用加速.今日頭條.2025-08-07
豆包App更新實時語音通話功能,中文對話斷崖式領先,人機難辨!.今日頭條.2025-08-07
豆包App更新實時語音通話功能,中文對話“人機難辨”.今日頭條.2025-11-05
揭秘豆包音視頻通話幕后技術,自己開發產品也能用.騰訊云.2025-12-04
豆包上線視頻通話功能,支持實時視頻問答.搜狐網.2025-08-23
豆包上線AI播客功能,入局“耳朵經濟”賽道.今日頭條.2025-09-20
豆包AI編程新增可視化編輯功能:支持在預覽界面直接編輯文字、智能換圖.新浪財經.2025-08-07
視頻效果震撼,又一款AI產品刷屏!《黑神話:悟空》制作人馮驥:很慶幸它來自中國.微信公眾平臺.2026-02-10
Seedance 2.0:AI 視頻第一階段的比賽,結束了|AI 上新.微信公眾平臺.2026-02-12
實測Seedance 2.0:當AI成為導演,Sora 2被超越了?.千龍網.2026-02-10
豆包App開啟Seedance 2.0灰度測試 .百家號.2026-02-12
豆包視頻生成模型Seedance 2.0 上線.今日頭條.2026-02-12
湯姆貓:公司AI情感陪伴機器人產品調用了豆包、DeepSeek等模型的部分能力.36氪.2026-02-07
豆包 AI 助手將上線蓮花跑車,宣稱“原生能力深度融合”.百家號.2025-07-30
豆包大模型上車賽力斯自有品牌.新華網.2026-01-14
字節上線AI對話產品“豆包”.今日頭條.2023-10-23
字節跳動AI對話產品“豆包”上線 回應:仍是小范圍邀請制測試,存在較多局限.今日頭條.2023-10-23
字節跳動抖音子公司推出AI機器人“豆包”,現已開始對外測試.今日頭條.2023-10-23
你光看見豆包火了,卻沒見豆包背后的大模型有多卷.鈦媒體.2025-07-30
智源評測出爐:豆包大語言模型排名第一,多模態能力獲得三項第二.今日頭條.2025-07-30