深度剖析字節豆包AI

4 評論 4630 瀏覽 50 收藏 50 分鐘

在國內的AI產(chǎn)品中,不少都做了APP以供用戶(hù)更方便地使用,豆包就是其中之一。這篇文章,我們嘗試對豆包AI進(jìn)行深度分析,看看能否通過(guò)這款比較典型的產(chǎn)品,了解AI 助手APP這個(gè)賽道。

這將會(huì )是三白的又一篇萬(wàn)字以上的深度分析報告,作為一個(gè)AI深度愛(ài)好者以及從業(yè)人員,從去年8月份字節豆包上線(xiàn)至今,我一直都在密切的關(guān)注這款產(chǎn)品的每一次更新和動(dòng)向,并頻繁和字節已經(jīng)行業(yè)內的AI從業(yè)的朋友們交流和討論這款產(chǎn)品,最近花了近3天左右的時(shí)間,把過(guò)去1年的積累的內容重新整理并輸出形成一個(gè)完整的報告。

全篇內容共13000字,閱讀時(shí)間預計需要半小時(shí),我將按照一個(gè)標準的產(chǎn)品分析報告的視角,系統的介紹和分享個(gè)人關(guān)于字節豆包這款產(chǎn)品的一些觀(guān)察、分析、思考,我將從產(chǎn)品、行業(yè)、商業(yè)、用戶(hù)、競品等多個(gè)角度綜合分析這款目前字節炙手可熱的AI產(chǎn)品,需要聲明的是,以下全部?jì)热輧H代表個(gè)人觀(guān)點(diǎn),內容僅供參考,若存在有失偏頗的地方歡迎大家和我溝通討論;

由于內容較多,為了提升大家的閱讀效率,我整理了一個(gè)全文腦圖如下,沒(méi)有時(shí)間細細閱讀的朋友可以快速看腦圖即可:

1.為什么想分析字節豆包這款產(chǎn)品?

一般我挑選分析對象,通常會(huì )選擇該賽道比較典型、或者有代表性的產(chǎn)品,也最好希望通過(guò)一個(gè)產(chǎn)品能夠把這個(gè)賽道基本了解清楚,一方面我先不選擇ChatGPT,主要是它是海外的產(chǎn)品,可能很多用戶(hù)都體驗不到,而豆包為國內公開(kāi)使用的產(chǎn)品,且目前在使用規模上據個(gè)人了解目前是用戶(hù)規模前三的AI產(chǎn)品;另外一方面,豆包對比chatgpt,在產(chǎn)品特性上,除了基本具備Chatgpt的大部分功能之外,還增加了關(guān)于智能體agent、Agent開(kāi)發(fā)平臺、AI社交、開(kāi)發(fā)者和創(chuàng )作者生態(tài)等多個(gè)領(lǐng)域,所以能夠覆蓋的領(lǐng)域,因此分析它的價(jià)值可能更高;

2.全文內容的信息獲取來(lái)源?

本篇文章全部?jì)热莺托畔⒅饕谌缦聨讉€(gè)信息來(lái)源:

  • 個(gè)人基于長(cháng)期對產(chǎn)品的關(guān)注、體驗、思考而形成的個(gè)人觀(guān)點(diǎn);
  • 來(lái)自和騰訊、字節、百度、阿里等國內大廠(chǎng)的AI從業(yè)朋友的討論與交流;
  • 參考市面上公開(kāi)的深度資訊、專(zhuān)題分析、公開(kāi)報道、數據平臺等;

3.適合哪些人群?

  • 想要系統的了解AI應用端產(chǎn)品,建立行業(yè)認知的朋友;
  • AI產(chǎn)品經(jīng)理和運營(yíng)人員;
  • 研究AI和字節產(chǎn)品的金融或者戰略研究人員;

一、產(chǎn)品概述

1.1. 產(chǎn)品基本信息介紹

1.1.1. 豆包是一款什么產(chǎn)品?

豆包是字節跳動(dòng)在2023年8月份推出的一款AI產(chǎn)品,產(chǎn)品直接對標的競品是ChatGPT、文心一言這一類(lèi)的產(chǎn)品,屬于字節跳動(dòng)在chatbot領(lǐng)域推出的重量級產(chǎn)品,此外,字節還在海外上線(xiàn)了一款豆包海外版的產(chǎn)品,產(chǎn)品名稱(chēng)是cici;

產(chǎn)品在字節跳動(dòng)公司內的組織架構是在字節去年11月份剛成立的FLOW團隊,根據flow業(yè)務(wù)負責人朱駿公開(kāi)信息,目前豆包在國內的月活已經(jīng)有2600萬(wàn),算是目前國內活躍規模最高的AI產(chǎn)品,目前應用內已經(jīng)累計創(chuàng )建了800萬(wàn)+智能體;

與ChatGPT和文心一言等ChatAI類(lèi)的產(chǎn)品不同的是,豆包的產(chǎn)品定位更傾向于成為一個(gè)綜合性的AI 智能體(AI Agent)平臺,產(chǎn)品整體的交互形式以智能體的形式呈現,通過(guò)一個(gè)個(gè)智能體(Agent)的方式滿(mǎn)足用戶(hù)在不同應用場(chǎng)景的使用需求;通用場(chǎng)景下,用戶(hù)可以和“豆包”默認智能體聊天對話(huà),也可以尋找其他垂直應用的智能體對話(huà)解決垂直場(chǎng)景的問(wèn)題;

1.1.2. 豆包的研發(fā)背景和發(fā)展歷程

官方對于為什么產(chǎn)品叫豆包的說(shuō)法是,一開(kāi)始想著(zhù)是抖音內的AI工具包,或者是抖音內的所有AI應用都包了,所以叫豆包,很多用戶(hù)調侃這個(gè)名字取的太過(guò)于俗氣,但是目前從行業(yè)的風(fēng)氣上看,大廠(chǎng)的AI產(chǎn)品們都傾向于取一些比較實(shí)物化、普通而接地氣的名字,而不是一些高大上的名字;

豆包的前身是字節去年內部孵化的產(chǎn)品項目,名稱(chēng)是Grace,當時(shí)Grace還沒(méi)有上升到整個(gè)公司重視的程度,據了解當時(shí)公司內部高層對于A(yíng)I的態(tài)度還處于想搞清楚這是個(gè)什么東西的階段,創(chuàng )始人張一鳴也在不停地會(huì )話(huà)行業(yè)內的專(zhuān)家試圖了解大模型到底是怎么回事的階段;

23年8月份的時(shí)候豆包開(kāi)始灰度上線(xiàn),當時(shí)的用戶(hù)體量還不是很大,月活可能10萬(wàn)都不到,并且在8~10月份一直保持著(zhù)自然增長(cháng),根據QM公開(kāi)的數據統計,豆包的整體活躍在11月份的時(shí)候開(kāi)始了跳躍性的增長(cháng),月活已經(jīng)開(kāi)始超過(guò)1000萬(wàn),個(gè)人猜測產(chǎn)品從11月份開(kāi)始對外投放廣告,因此帶來(lái)了比較明顯的增長(cháng),后來(lái)又經(jīng)過(guò)半年左右的時(shí)間,5月月活規模達到2600萬(wàn)規模(參考字節官方公布數據);

1.2. 產(chǎn)品定位

1.2.1. 豆包的產(chǎn)品定位:從產(chǎn)品、公司戰略的角度看產(chǎn)品定位

1)從產(chǎn)品形態(tài)的角度看產(chǎn)品定位從產(chǎn)品形態(tài)上看,前面也提到,豆包的產(chǎn)品定位是一個(gè)綜合性的AI智能體平臺;目前豆包內的智能體包括3種類(lèi)型:

  1. 豆包默認智能體:這個(gè)是用戶(hù)默認使用的智能體,用戶(hù)首次使用時(shí)進(jìn)入的是豆包默認的智能體,新建對話(huà)的時(shí)候也是默認調起默認智能體;
  2. PGC智能體:第二部分是豆包官方創(chuàng )建的智能體,目前豆包官方創(chuàng )建了25個(gè)官方智能體,包括AI圖片生成、愛(ài)聊天的小寧、全能寫(xiě)作助手等;
  3. UGC智能體:這部分是用戶(hù)自己創(chuàng )建的智能體,根據官方公示,截止到24年5月份,豆包應用內目前已經(jīng)有將近800萬(wàn)的智能體;

2)從公司戰略的角度看產(chǎn)品定位從公司戰略的角度上看,產(chǎn)品的定位包括如下幾點(diǎn):

  • 豆包更傾向于打造成為公司的品牌和門(mén)面的AI產(chǎn)品,包括從目前的產(chǎn)品規模和增長(cháng)趨勢,以及公司的大模型名稱(chēng)從之前的云雀大模型改名為豆包大模型,種種跡象都表明,公司有意將這款產(chǎn)品打磨成為一款明顯標桿產(chǎn)品,甚至成為公司的品牌和門(mén)面的AI產(chǎn)品;
  • 豆包也是字節大模型秀肌肉的產(chǎn)品,目前豆包整體一直都免費開(kāi)放給用戶(hù)使用,起成本和消耗也不小,但是個(gè)人認為這是一種通過(guò)C端占領(lǐng)用戶(hù)市場(chǎng)和心智,然后帶動(dòng)大模型售賣(mài)的一種方式,企業(yè)級的客戶(hù)通過(guò)使用和體驗豆包的能力可以感受和對比豆包大模型的能力,如此更加有利于大模型的售賣(mài),所以豆包也是字節大模型體驗和秀肌肉的產(chǎn)品;
  • 豆包是字節AI場(chǎng)景的試驗田,在扶持一個(gè)體量較大的AI產(chǎn)品之后,豆包也承擔起了AI應用場(chǎng)景和市場(chǎng)驗證的責任,目前個(gè)人感受到的思路是,flow團隊會(huì )將一些想要驗證的場(chǎng)景以智能體的方式放到豆包應用內驗證并觀(guān)察的增長(cháng)的數據情況并驗證需求,一旦需求和市場(chǎng)獲得了驗證,便采用獨立APP的方式單獨運作;這樣的案例,目前可以看到有貓箱、coze等產(chǎn)品;

1.3. 產(chǎn)品核心產(chǎn)品能力

目前chatbot類(lèi)的產(chǎn)品功能基本都大同小異,因此這里也就不面面俱到的產(chǎn)品具體產(chǎn)品的功能,個(gè)人主要分享幾點(diǎn)個(gè)人認為豆包做的相對還比較不錯的,或者可以算的上產(chǎn)品核心能力的產(chǎn)品功能;

1.3.1.手機端核心產(chǎn)品功能

  • 沉浸態(tài)的語(yǔ)音對話(huà)的功能:目前從大部分使用用戶(hù)的反饋看,豆包的語(yǔ)音對話(huà)聊天的功能在自然度、擬人化和流暢度等方面都是相對來(lái)說(shuō)比較不錯的,和文心一言等競品可以形成相對的差異,個(gè)人也主要是通過(guò)行業(yè)內的研究人員們關(guān)注到這點(diǎn),可見(jiàn)目前字節在語(yǔ)音模型、語(yǔ)音合成等方面確實(shí)具備比較領(lǐng)先的技術(shù)優(yōu)勢;
  • 自定義智能體:用戶(hù)可以通過(guò)創(chuàng )建智能體的方式自己捏一個(gè)角色或者智能體,并應用于個(gè)人使用,或者公開(kāi)給他人使用,目前APP內創(chuàng )建智能體的方式比較簡(jiǎn)單,只提供了prompt、頭像、聲音配置的選項,沒(méi)有提供太多個(gè)性化的配置能力,這部分個(gè)性化的能力目前在智能體開(kāi)發(fā)平臺扣子/coze里面實(shí)現;
  • 發(fā)現智能體:該模塊主要滿(mǎn)足需要想要尋找垂直應用場(chǎng)景的智能體的需求,目前發(fā)現智能體模塊提供了頭像生成、學(xué)習、AI繪畫(huà)、游戲動(dòng)漫、角色扮演、影視小說(shuō)、工作、創(chuàng )作、生活、情感、趣味等十幾類(lèi)智能體;
  • 文生圖能力:豆包目前支持文生圖的功能,個(gè)人體驗了國內多款文生圖的chatbot類(lèi)產(chǎn)品,目前在生成質(zhì)量、準確性等方面,豆包的表現還是相對比較不錯的,因此個(gè)人認為目前在視覺(jué)生成方面,可能字節的能力和表現會(huì )相對更好一些;
  • AI生成文本+短視頻推薦組合形成query回復:目前當你涉及一些吃喝玩樂(lè )相關(guān)的話(huà)題的時(shí)候,豆包除了生成文字回復,還會(huì )推流一個(gè)抖音短視頻給用戶(hù),這種方式主要是為了解決模型無(wú)法很好的應對實(shí)時(shí)性和物理世界相關(guān)的信息這個(gè)問(wèn)題,配合人工生成的短視頻,可能能夠更好的解答用戶(hù)的問(wèn)題,讓回復質(zhì)量更高;
  • 本地生活推薦:豆包支持基于用戶(hù)的LBS推薦用戶(hù)定位附近的商家,給用戶(hù)提供本地生活推薦的服務(wù),這塊的功能,個(gè)人猜測是接入了抖音本地生活推薦的數據,但是目前該功能還沒(méi)有大力做,產(chǎn)品體驗和使用價(jià)值相對一般,但是在眾多的AI產(chǎn)品里面,目前只看到了豆包做了這個(gè)嘗試,也算是一個(gè)值得一提的功能;

1.3.2.電腦端核心產(chǎn)品功能

豆包電腦端目前除了網(wǎng)頁(yè)端web版的功能,還推出了PC客戶(hù)端的版本,整體產(chǎn)品以瀏覽器的形式存在,基本有點(diǎn)類(lèi)似于對標360AI瀏覽器,其核心功能包括如下:

  • AI搜索:AI和搜索結合的場(chǎng)景,是AI的一個(gè)關(guān)鍵應用領(lǐng)域,目前豆包的AI搜索功能,個(gè)人認為在搜索結果的時(shí)效性、準確性等方面是相對比較不錯的,其AI搜索的能力,個(gè)人認為甚至目前做的比文心一言的AI搜索還更好一些;據個(gè)人了解,百度搜索目前在A(yíng)I搜索領(lǐng)域的布局目前還處于觀(guān)望和滯后狀態(tài),可能因為AI搜索的成本比較高,并且AI搜索會(huì )沖擊傳統搜索廣告的業(yè)務(wù),所以目前沒(méi)有重點(diǎn)發(fā)力;

  • 文檔對話(huà)和閱讀總結:文檔對話(huà)的產(chǎn)品目前也比較多,包括以kimi為主的產(chǎn)品,大家的體驗表現上其實(shí)都差不多,但是個(gè)人體驗到的豆包表現優(yōu)越的點(diǎn)在于模型的OCR能力更好,例如上傳掃描件PDF文檔的時(shí)候,豆包可以準確是識別文檔的內容,但是kimi等產(chǎn)品并沒(méi)有達到響應的水平;
  • 內容創(chuàng )作:支持細分場(chǎng)景的AI內容創(chuàng )作,從之前通用的AI創(chuàng )作工具,到目前逐步支持場(chǎng)景化創(chuàng )作,總體上比之前更近一步了,但是說(shuō)實(shí)話(huà)從目前的創(chuàng )作結果上,還沒(méi)有達到專(zhuān)業(yè)級的水平,相比市面上垂直應用領(lǐng)域的AI寫(xiě)作產(chǎn)品還是差了一些;

  • 瀏覽器插件:瀏覽器插件的功能是今年5月份左右剛剛推出的功能,能支持在瀏覽器里面實(shí)現基于頁(yè)面瀏覽的AI功能,包括劃詞搜索和翻譯、頁(yè)面摘要、視頻轉文字等實(shí)用功能,目前做的還比較不錯并保持著(zhù)很高頻率的產(chǎn)品更新;關(guān)于插件安裝體驗,可訪(fǎng)問(wèn)如下文檔 https://bytedance.larkoffice.com/wiki/ZwUjwehjyibYCTksatkcb9iXnKc

  • 電腦插件:整體功能和瀏覽器插件差不多,支持切換到電腦的應用場(chǎng)景;具體使用可搜索下載豆包電腦客戶(hù)端,安裝后進(jìn)入首頁(yè)即有相關(guān)引導;

1.4. 豆包的關(guān)鍵版本迭代記錄

過(guò)去一年,基本豆包的每一次產(chǎn)品更新,我都在重點(diǎn)的關(guān)注,其中個(gè)人認為值得關(guān)注的重點(diǎn)包括:

  • 去年11月份的版本更新是豆包產(chǎn)品整體改頭換面的一個(gè)版本,實(shí)現了幾乎豆包大部分的核心能力;
  • 之后的版本里陸續通過(guò)各種動(dòng)作探索和發(fā)展第三方智能體的價(jià)值;
  • 2月份和扣子打通,支持扣子創(chuàng )建并發(fā)布智能體到豆包;
  • 3月份強化搜索和文件對話(huà)能力,應對kimi的市場(chǎng)熱度;
  • 以及Q2重點(diǎn)發(fā)展PC客戶(hù)端和瀏覽器插件;

具體的版本迭代明細見(jiàn)下:

23年11月迭代版本

  • 推出22個(gè)豆包官方智能體:包括英語(yǔ)學(xué)習助手、聊天、AI生成漫畫(huà)、音樂(lè )電臺、智能體創(chuàng )建助手、ai生成圖片、文學(xué)伴侶、戀愛(ài)大事、旅游規劃師、電影評論家、星座運勢、起名專(zhuān)家、本地推薦、編程助手;
  • 強化AI聯(lián)網(wǎng)搜索能力:和今日頭條、抖音搜索數據打通,生成的搜索結果支持溯源并打開(kāi)跳轉頭條和外部網(wǎng)站的內容,支持查看出處,目標是為了增加生成結果的可靠性問(wèn)題;這個(gè)階段,豆包開(kāi)始和頭條搜索和抖音搜索密切合作,聯(lián)網(wǎng)搜索的能力也主要是基于頭條和抖音搜索,尚未拓展到全網(wǎng)搜索;
  • 增加了關(guān)聯(lián)問(wèn)題推薦的功能:基于用戶(hù)的問(wèn)題提供問(wèn)題推薦的功能,節省用戶(hù)輸入問(wèn)題的時(shí)間,提供提問(wèn)的靈感幫助用戶(hù)獲得更多的信息,增加用戶(hù)提問(wèn)的頻率;
  • 支持LBS的本地生活搜索推薦:其中美食推薦還比較準確,但是其他的推薦還不準確,包括酒店、生活服務(wù)等;
  • 支持文生圖的產(chǎn)品能力;
  • 首頁(yè)改版強化智能體模塊:發(fā)現智能體的入口從右上角遷移到底部欄,增加了AI智能體的模塊,進(jìn)一步的強化了智能體平臺的定位,同時(shí)也可以看出對發(fā)展智能體生態(tài)的重視;
  • 支持抖音短視頻內容推薦:生成文本的同時(shí)匹配與之相關(guān)的相關(guān)匹配度最高的短視頻內容;該能力主要彌補ai生成內容泛化的問(wèn)題,AIGC+UGC互補結合更好的解決用戶(hù)對回復內容滿(mǎn)意度的問(wèn)題,同時(shí)抖音短視頻的內容真實(shí)性的感覺(jué)更強,進(jìn)一步解決用戶(hù)對生成內容的信任感問(wèn)題;

24年1月迭代版本

  • 首頁(yè)改版進(jìn)一步強化智能體的露出:智能體置頂到首頁(yè)頂部,支持滑動(dòng)展示;
  • 開(kāi)始對智能體做進(jìn)一步的分類(lèi):分類(lèi)整理出不同的分類(lèi)的智能體,這個(gè)階段可見(jiàn)智能體的規模已經(jīng)初步發(fā)展起來(lái);
  • 將搜索框固定到首頁(yè)頂部,強化搜索功能,但是后來(lái)又將搜搜框下架,主要原因可能因為搜索體驗不佳,或者也可能是針對AI搜索的一次測試;

24年2月迭代版本

  • 虛擬聊天智能體增加聊天背景封面優(yōu)化聊天氛圍,體驗越來(lái)越像星野,且智能體創(chuàng )建支持AI生成頭像以及支持AI生成提示詞;
  • 國內版智能體開(kāi)發(fā)平臺“扣子”上線(xiàn),和豆包打通,支持發(fā)布豆包;
  • 豆包AI拓展字節內部其他產(chǎn)品:包括抖音應用內上線(xiàn)AI搜索功能,今日頭條APP首頁(yè)右上角上線(xiàn)豆包AI功能,內嵌頭條;

24年3月迭代版本

  1. 智能體開(kāi)始灰度支持定制個(gè)人的音色功能;
  2. 增加文檔對話(huà)分析能力:支持上傳PDF、表格、PPT、word、txt等格式文件,不支持圖片格式,文檔大小限制50個(gè)以?xún)?,大小限?0M以?xún)龋?/li>
  3. 接入bing搜索,聯(lián)網(wǎng)搜索拓展全網(wǎng)搜索,支持抖音搜索和頭條搜索之外的內容搜索;
  4. 上線(xiàn)豆包PC客戶(hù)端和瀏覽器插件;

24年5月迭代版本

  1. PC端推出“問(wèn)答”能力:整體產(chǎn)品形態(tài)對標知乎產(chǎn)品,目前主要通過(guò)搜索問(wèn)答類(lèi)的內容,通過(guò)搜索引擎入口引流;為利用AI問(wèn)答的能力做的搜索投放獲客的能力;官方將問(wèn)答內容和生成結果沉淀為問(wèn)答內容,形成一個(gè)問(wèn)答社區;社區鏈接如下:https://www.doubao.com/traffic/ask
  2. 瀏覽器插件更新:支持b站視頻總結、ARXIV論文閱讀;

24年6月迭代版本

  • 豆包瀏覽器插件更新:支持youtube視頻總結和中英雙字幕,詳細功能參考如下文檔:https://bytedance.larkoffice.com/wiki/ZwUjwehjyibYCTksatkcb9iXnKc

二、產(chǎn)品所屬賽道分析

2.1. 賽道定義與細分

2.1.1. AI的賽道細分

對于目前的AI的賽道,個(gè)人總結賽道的整體布局如下,其中今年上半年比較火熱的應用領(lǐng)域,基本聚焦在chatbot、智能體開(kāi)發(fā)平臺、虛擬社交、AI搜索這幾個(gè)領(lǐng)域:

2.1.2. 豆包所屬細分賽道:Chatbot賽道

盡管很多人對于豆包的產(chǎn)品定位比較有爭議,稱(chēng)它長(cháng)得像ChatGPT,又長(cháng)得像character.ai,但個(gè)人認為,目前的整體產(chǎn)品形式,基本都是源于ChatGPT,所以我更傾向于歸類(lèi)為chatbot賽道;

2.1.3. 賽道內的主要競爭者和市場(chǎng)競爭情況

既然歸屬于chatbot賽道,因此其主要的競爭對手主要包括ChatGPT、文心一言、騰訊元寶等產(chǎn)品;另外因為豆包和核心功能還包括虛擬社交、AI搜索等場(chǎng)景,所以kimi、character.ai、星野等產(chǎn)品,也可以視為其主要競品;

目前從用戶(hù)體量上看,海外活躍規模的體量整體相對更高,ChatGPT毫無(wú)爭議為目前全球活躍規模最高的AI應用產(chǎn)品;

對于國內,文心一言目前根據QM和similarweb提供的相關(guān)數據,截止今年3月份WEB+APP的整體月活將近3000萬(wàn)左右,而豆包截止5月對外公開(kāi)的月活規模是2600萬(wàn),其后是kimi月活將近1800萬(wàn);

三、核心產(chǎn)品技術(shù)分析

3.1.MOE架構模型

豆包的應用內承載力虛擬社交聊天、AI搜索、文檔對話(huà)、文生圖、內容創(chuàng )作等多種使用場(chǎng)景,如此之多的功能放在一個(gè)產(chǎn)品里面,很難只是通過(guò)一個(gè)通用的大模型就能支持所有的產(chǎn)品能力,必然需要用到多種模型能力,因此豆包的底層采用的應該是MOE(混合專(zhuān)家模型)架構的模型;

MOE模型簡(jiǎn)單講就是在模型中組合了多種類(lèi)型的模型,在處理實(shí)際的任務(wù)的時(shí)候,動(dòng)態(tài)匹配解決任務(wù)需要的模型組合,高效的執行任務(wù);以在豆包內構建一個(gè)實(shí)時(shí)資訊聊天機器人并語(yǔ)音對話(huà)為例,整個(gè)過(guò)程中可能涉及到如下幾個(gè)模型:

  • 角色扮演模型:在用戶(hù)創(chuàng )建一個(gè)虛擬角色的時(shí)候,后臺可能會(huì )使用角色扮演模型輔助用戶(hù)創(chuàng )建一個(gè)具體角色的Agent;
  • RAG模型(增強檢索模型):用戶(hù)在和角色聊天的時(shí)候,因為用戶(hù)對話(huà)的query要求的是實(shí)時(shí)的資訊聊天,所以模型在響應的時(shí)候,需要基于聯(lián)網(wǎng)檢索的結果做生成輸入,所以這個(gè)環(huán)節可能需要調用RAG模型,完成響應輸出;
  • TTS模型(文本轉語(yǔ)音模型):模型完成文本的輸出之后,需要將文本合成為語(yǔ)音之后以語(yǔ)音的方式輸出給用戶(hù),這個(gè)過(guò)程需要用到TTS模型;

以上我們通過(guò)一個(gè)案例理解什么是MOE架構模型以及其工作原理,接下來(lái)個(gè)人猜測一下豆包的MOE模型中可能混合的哪些專(zhuān)家模型:

  • 基礎大模型:也就是豆包大模型,在解決一些通用場(chǎng)景的內容生成,例如豆包默認智能體的生成輸出的時(shí)候,大概率可能直接使用的是基礎大模型;
  • 行業(yè)大模型:包括在解決虛擬聊天和角色扮演等應用場(chǎng)景的時(shí)候,可能使用的是角色扮演模型;
  • 文生圖模型:涉及圖像生成等場(chǎng)景的時(shí)候,必然使用的是圖像生成模型;
  • 語(yǔ)音合成模型、音色定制模型:目前語(yǔ)音聊天的場(chǎng)景,包括提供不同的音色,以及語(yǔ)音聊天的輸出,都是通過(guò)語(yǔ)音合成模型和音色定制模型技術(shù)實(shí)現;
  • RAG模型(增強檢索模型)、知識圖譜:如前舉例,涉及需要聯(lián)網(wǎng)檢索,或者調用外部知識庫解答的問(wèn)題,可能會(huì )用到RAG模型和知識圖譜技術(shù);
  • 向量化模型:例如在回答用戶(hù)問(wèn)題時(shí),通過(guò)向量化模型,系統可以快速查找到和用戶(hù)問(wèn)題相關(guān)的知識并生成準確的回答,向量化模型主要用于將知識庫向量化,方便根據用戶(hù)問(wèn)題匹配到跟用戶(hù)最相關(guān)的知識,然后生成回答;

四、商業(yè)模式分析

4.1.關(guān)于豆包當前的商業(yè)路徑的思考

當前豆包基本完全免費,并且無(wú)限量的提供給用戶(hù)使用,在C端基本沒(méi)有商業(yè)付費的場(chǎng)景,個(gè)人認為目前豆包的商業(yè)模式更多的是C端免費使用,形成市場(chǎng)規模、品牌效應和用戶(hù)教育之后,通過(guò)模型端收費,但是鑒于最近這段時(shí)間字節大模型大幅度降價(jià)之后,可能短期售賣(mài)模型也不賺錢(qián),而是通過(guò)模型消耗帶來(lái)的基礎云服務(wù)的售賣(mài),其商業(yè)變現的鏈條如下:

豆包C端免費———>企業(yè)端購買(mǎi)大模型,帶動(dòng)云服務(wù)售賣(mài)———>通過(guò)售賣(mài)云服務(wù)賺錢(qián);

所以,當前的商業(yè)路徑,表面上是在做AI產(chǎn)品,實(shí)際上可能兜兜轉換最后可能變成了賣(mài)傳統的云服務(wù)賺錢(qián)。

4.2.豆包未來(lái)可能通過(guò)什么模式實(shí)現商業(yè)化

參考目前市面上競品的做法以及個(gè)人的看法,未來(lái)豆包的商業(yè)化方式可能包括如下3種方式:

1)個(gè)人增值訂閱的模式:個(gè)人增值訂閱簡(jiǎn)單講就是付費會(huì )員,與ChatGPT的plus訂閱,文心一言的會(huì )員類(lèi)似,增值訂閱目前是廣泛的用戶(hù)普遍可以接受的一種方式,而增值訂閱的方式,關(guān)鍵在于未來(lái)通過(guò)什么增值功能引導用戶(hù)付費,我覺(jué)得可能的增值點(diǎn)可能包括:

  • 更強的模型:例如免費用戶(hù)使用基礎模型,使用更強的模型需要付費;
  • 付費智能體:例如圖像生成等對成本消耗比較高的智能體智能限量使用,超過(guò)一定使用量之后需要付費;
  • 增值功能付費:包括深度檢索功能、音色定制功能、上傳文件大小等;

2)廣告模式:作為互聯(lián)網(wǎng)廣告的收入大戶(hù),即使在A(yíng)I產(chǎn)品,未來(lái)也未嘗不可嘗試廣告變現的模式,其中包括檢索生成的索引入口、商家和服務(wù)的推薦等,都可能是比較合適的廣告入口,當產(chǎn)品的體量逐步上來(lái)之后,廣告的規??赡芤矔?huì )比較可觀(guān);

3)應用分成模式:目前豆包應用內的第三方智能體為用戶(hù)創(chuàng )建并維護,未來(lái)也不排除可以做成付費智能體的可能性,特別是通過(guò)coze/扣子創(chuàng )建并發(fā)布到豆包的智能體,當第三方智能體支持付費,并且豆包內打通支付路徑之后,作為平臺方也可以向第三方應用抽取分成;

以上三種方式,僅為個(gè)人猜測,并且個(gè)人認為增值訂閱和廣告模式的概率比較高,應用分發(fā)的難度相對會(huì )比較大,目前豆包官方暫時(shí)也沒(méi)有對外公開(kāi)其商業(yè)化的計劃和進(jìn)展情況;

4.3.豆包未來(lái)的付費用戶(hù)可能是誰(shuí)?

個(gè)人認為,對于豆包類(lèi)的chatbot的產(chǎn)品,未來(lái)潛在的主要付費群體包括如下幾種:

  • AI愛(ài)好者:也就是ChatGPT帶起來(lái)的第一批AI的興趣用戶(hù),這批用戶(hù)具備非常高的質(zhì)量,既理性又有消費力,愿意為價(jià)值買(mǎi)單,我的身邊有非常多的這樣的群體,他們甚至愿意想盡一切辦法購買(mǎi)訂閱費用比較貴的ChatGPT plus的會(huì )員,屬于高價(jià)值、付費購買(mǎi)意愿比較強的群體,該部分群體的整體年齡也相對比較高,大部分聚焦在30~40歲的用戶(hù),并且男性用戶(hù)居多;
  • 辦公族群體:包括商務(wù)辦公、學(xué)習教育、營(yíng)銷(xiāo)創(chuàng )作、商業(yè)服務(wù)、金融法律等行業(yè)和場(chǎng)景的用戶(hù)群體,解決的是不同領(lǐng)域的工作場(chǎng)景的需求,大部分用戶(hù)更愿意為場(chǎng)景付費,該部分用戶(hù)的年齡聚焦在25歲~40歲區間的群體;
  • 中小學(xué)生群體:社交和游戲偏好的群體可能也會(huì )是主要的付費用戶(hù),虛擬社交目前也是豆包的重要使用場(chǎng)景,個(gè)人該領(lǐng)域用戶(hù)畫(huà)像觀(guān)測分析認為,該場(chǎng)景在年輕人群體中的偏好較高,未來(lái)年輕一代的用戶(hù)可能更加愿意為虛擬社交和娛樂(lè )聊天付費;

4.4.用戶(hù)的核心付費動(dòng)機和需求是什么?

  • 為效率提升付費:現在大部分用戶(hù)更傾向于希望AI產(chǎn)品是一個(gè)提升效率的工具,所以用戶(hù)更傾向于為效率付費,包括生產(chǎn)效率、信息獲取效率、學(xué)習效率、辦公效率、溝通效率、決策效率等,其中生產(chǎn)效率和信息獲取效率的提升是用戶(hù)需求更強的場(chǎng)景;
  • 為精神娛樂(lè )和情緒價(jià)值付費:AI除了以實(shí)用價(jià)值為出發(fā)點(diǎn)的效率場(chǎng)景之外,還有以虛擬社交等為例的精神娛樂(lè )和情緒價(jià)值的應用場(chǎng)景,該場(chǎng)景用戶(hù)為社交獵奇、情感陪伴、情緒宣泄等付費;

那么,對于效率和娛樂(lè )這兩個(gè)方向,預計哪個(gè)有可能更快看到商業(yè)變現?

個(gè)人認為娛樂(lè )方向的變現價(jià)值可能會(huì )跑的更快,因為效率場(chǎng)景的變現極大的依賴(lài)大模型的能力,要想要做出一個(gè)能解決具體的效率場(chǎng)景的產(chǎn)品出來(lái),現在說(shuō)實(shí)話(huà)真的太難了,而對于效率群體而言,普通的產(chǎn)品能力如果不能切實(shí)的解決他們的問(wèn)題,用戶(hù)斷然是不愿意付費的,所以效率場(chǎng)景短期變現難;而娛樂(lè )場(chǎng)景,目前模型的能力基本也足以滿(mǎn)足,用戶(hù)的付費也有更多的是沖動(dòng)付費的場(chǎng)景,因此目前從市場(chǎng)上看,投資人們更多的偏好虛擬社交的產(chǎn)品;

4.5.豆包的成本結構

對于豆包類(lèi)的AI產(chǎn)品,其核心成本主要包括技術(shù)、人力、市場(chǎng)營(yíng)銷(xiāo)費用這幾部分成本,至于具體的成本規模,尚不得而知;

  • 技術(shù)成本:包括模型成本、服務(wù)器和帶寬成本;
  • 人力成本:包括研發(fā)人員、產(chǎn)品和運營(yíng)人員的人力成本
  • 市場(chǎng)費用:拉新獲客的市場(chǎng)投放、市場(chǎng)營(yíng)銷(xiāo)的成本;

五、字節的AI產(chǎn)品布局和豆包的位置

5.1.字節激進(jìn)的AI應用布局

從去年的6月份開(kāi)始,字節已經(jīng)開(kāi)始密集的布局AI領(lǐng)域的應用,去年8月的時(shí)候,字節還只是上線(xiàn)了豆包、小悟空等少數幾個(gè)產(chǎn)品,半年多過(guò)去,目前字節在國內和國外已經(jīng)上線(xiàn)了十幾個(gè)AI應用,覆蓋了不同的熱門(mén)賽道,可謂全面開(kāi)花,基本在大廠(chǎng)里面,在A(yíng)I應用層如此激進(jìn)的,基本也就字節了;

縱觀(guān)字節的整個(gè)AI布局,可以看到,基本上半年幾個(gè)火熱的AI應用領(lǐng)域,字節基本都入局了,包括以豆包為標桿的Chatbot領(lǐng)域、以貓箱為主的虛擬社交領(lǐng)域,以扣子為主的智能臺開(kāi)發(fā)平臺領(lǐng)域,加上集團內其他舊產(chǎn)品和AI的結合,布局版圖非常大,其中對于豆包,從目前字節在產(chǎn)品的增長(cháng)投入、以及甚至將原來(lái)的大模型名稱(chēng)從云雀大模型改成豆包大模型等一系列動(dòng)作可以看出,豆包在整個(gè)字節的AI應用的地位非常重要;

5.2.如何看待字節的激進(jìn)和騰訊的冷靜?

一方面,個(gè)人認為字節在A(yíng)I的激進(jìn)是自上而下的,從字節的發(fā)展進(jìn)展和動(dòng)作上看,字節的高層非常重視并看到AI帶來(lái)的應用端的機會(huì ),并且迅速的開(kāi)啟了當年互聯(lián)網(wǎng)時(shí)代小步快跑、快速驗證市場(chǎng)需求的節奏,個(gè)人認為字節目前的發(fā)展思路存在如下幾個(gè)特點(diǎn):

  1. 快速占領(lǐng)應用端市場(chǎng):先在目前市場(chǎng)空白階段先通過(guò)應用端快速占領(lǐng)用戶(hù)市場(chǎng),并順利拋出一個(gè)AI領(lǐng)域的超級應用,未來(lái)掌握入局AI應用領(lǐng)域的第一張門(mén)票;
  2. 應用端積累更多的用戶(hù)數據,反哺大模型迭代優(yōu)化:應用端的數據越多,對于模型的迭代和發(fā)展就越有利;

另外一方面,反觀(guān)騰訊,過(guò)去半年騰訊在A(yíng)I應用側的進(jìn)展簡(jiǎn)直冷靜到讓人不敢相信,過(guò)去的一年里面對外公開(kāi)AI應用的產(chǎn)品并不多,并且原生AI應用的產(chǎn)品也很少,目前只有騰訊元寶、騰訊元器剛剛推出沒(méi)多久;雖然騰訊混元的負責人的觀(guān)點(diǎn)認為目前AI應用的滲透整體都很低,所以大家都在同一個(gè)起跑線(xiàn)上,但是不可否認的是,目前騰訊在A(yíng)I應用端的反應相對滯后,個(gè)人的觀(guān)點(diǎn)認為如下:

  • 大模型才是最核心的,應用端并不著(zhù)急:雖然騰訊在應用端的發(fā)聲比較少,但是根據個(gè)人了解,騰訊內部在模型端的投入并不低,騰訊混元集中了公司很多模型研發(fā)人員,并且對外招聘的力度也比較大,可見(jiàn)騰訊當前的重點(diǎn)還是先發(fā)現大模型的基礎能力;
  • 過(guò)早進(jìn)入應用端,并不會(huì )拉開(kāi)差距,成本和模型能力反而會(huì )限制增長(cháng)規模:對于掌握著(zhù)互聯(lián)網(wǎng)大半流量的騰訊而言,孵化一個(gè)超級應用的難度并不大,但是更多的還是應該先看清楚市場(chǎng)之后再出手,否則過(guò)早進(jìn)入,可能形成不了市場(chǎng)占有率優(yōu)勢,反而還受限成本以及模型能力,導致規模難以快速增長(cháng);

字節和騰訊對待AI應用的兩種不同的態(tài)度,基本也代表了目前市面上大家對AI的態(tài)度和心智,只能說(shuō)各有立場(chǎng)、沒(méi)有優(yōu)劣,只不過(guò)是不同認知下的選擇而已。

六、豆包如何實(shí)現用戶(hù)增長(cháng)?

以下內容,為個(gè)人觀(guān)測觀(guān)點(diǎn),尚未獲得實(shí)際數據驗證,個(gè)人認為豆包的獲客新增策略主要基于如下4個(gè)策略:

  • PLG產(chǎn)品驅動(dòng):通過(guò)持續拓展和新增更多的產(chǎn)品能力,覆蓋不同的AI賽道,滿(mǎn)足不同場(chǎng)景的使用需求,目前豆包基本兼容了主流的chatbot、虛擬社交、智能體創(chuàng )建、AI搜索、AI創(chuàng )作等多個(gè)方向的應用場(chǎng)景;
  • 廣告投放:大廠(chǎng)的產(chǎn)品的快速增長(cháng),自然離不開(kāi)廣告投放,豆包的快速增長(cháng)也主要依托字節內部的引流投放,包括抖音和頭條官方廣告、穿山甲廣告聯(lián)盟、抖音內容創(chuàng )作者投放等;
  • 智能體的裂變分享:用戶(hù)在使用智能體的過(guò)程中,可以把智能體鏈接分享給其他用戶(hù),給豆包帶來(lái)更多流量;
  • 插件化:從最近關(guān)注到的情況發(fā)現,豆包開(kāi)始做瀏覽器插件、電腦操作系統輔助插件、以及和今日頭條合作豆包ai助手、甚至傳言目前豆包正在和手機廠(chǎng)商合作手機助手,這些動(dòng)向表明了未來(lái)豆包的增長(cháng)會(huì )通過(guò)插件化的方式,對外釋放影響力和帶動(dòng)增長(cháng);

七、用戶(hù)畫(huà)像分析

7.1.豆包目前的用戶(hù)畫(huà)像分析

根據某第三方數據平臺觀(guān)察分析豆包APP用戶(hù)的畫(huà)像特征如下:

  1. 男性用戶(hù)為主:豆包活躍用戶(hù)中,將近70%的用戶(hù)為男性用戶(hù),女性用戶(hù)僅30%左右,對于該數據現象,個(gè)人認為和目前國內整體AI興趣偏好人群的分布有關(guān)系,或許對于A(yíng)I科技類(lèi)的產(chǎn)品,本身男性用戶(hù)天然就是比女性用戶(hù)更感興趣;想通的數據平臺,觀(guān)察文心一言等其他同類(lèi)型的產(chǎn)品,也存在男性用戶(hù)占比明顯高于女性用戶(hù)的特征;
  2. 25歲~40歲職場(chǎng)用戶(hù)群體為主:豆包活躍用戶(hù)中,年齡在25~40歲之間的用戶(hù)占比將近70%,為豆包的主流用戶(hù),參考整個(gè)互聯(lián)網(wǎng)大盤(pán)的數據,該年齡階段的用戶(hù)占大盤(pán)的占比近30%左右;

7.2.豆包未來(lái)的核心用戶(hù)群體是哪些?

豆包當前的用戶(hù)畫(huà)像更多的還是受目前市場(chǎng)用戶(hù)的整體情況所影響,個(gè)人認為,對于一個(gè)綜合性的AI智能體平臺,豆包的核心用戶(hù)群體,將逐步拓展如下用戶(hù):

  1. 年輕一代用戶(hù):包括大學(xué)生、中小學(xué)生群體,目前豆包的整體使用用戶(hù),更多的還是以職場(chǎng)白領(lǐng)群體為主,年輕用戶(hù)相對較少,鑒于虛擬社交場(chǎng)景也是豆包的重點(diǎn)發(fā)展場(chǎng)景之一,個(gè)人認為未來(lái)對于社交、游戲等新奇事物比較感興趣的年輕一代群體,將會(huì )是該場(chǎng)景的重要用戶(hù)群體;
  2. 拓展下沉用戶(hù)群體:目前AI和大模型的最新資訊,主要還是在一二線(xiàn)城市為主,未來(lái)下沉市場(chǎng)的用戶(hù)在A(yíng)I的使用滲透可能會(huì )越來(lái)越高;
  3. 女性用戶(hù)的占比逐步提升起來(lái):AI目前對于大部分人來(lái)說(shuō),還是個(gè)技術(shù)感比較強的東西,相比更加吸引男性用戶(hù),隨著(zhù)未來(lái)Ai的使用門(mén)檻和工程化越來(lái)越普及,女性用戶(hù)的占比會(huì )逐步提升起來(lái);

八、核心競品分析

8.1 核心產(chǎn)品能力對比

個(gè)人認為,衡量一個(gè)ChatBot類(lèi)的產(chǎn)品,其核心產(chǎn)品能力的對比應該包括如下幾個(gè)維度:

  1. 文本生成:這是LLM最基礎的能力,作為一個(gè)崇尚技術(shù)派的人,個(gè)人比較看重的是文本生成在邏輯推理、專(zhuān)業(yè)性、場(chǎng)景化等方面的表現,因為通用的生成能力對我而言是沒(méi)啥用的,我們需要專(zhuān)才來(lái)解決我們的問(wèn)題,而不是一個(gè)什么都會(huì )的通才;
  2. 語(yǔ)音聊天:其次是語(yǔ)音聊天的能力,包括語(yǔ)音聊天的流暢度、真實(shí)感、交互方式,我們需要的是一個(gè)接近真實(shí)的聊天AI,而不是一個(gè)像天貓精靈那樣的傻瓜機器人;
  3. 聯(lián)網(wǎng)搜索:不言而喻,聯(lián)網(wǎng)搜索的能力基本是一個(gè)chatbot產(chǎn)品非常關(guān)鍵的能力之一,也是一個(gè)核心競爭的產(chǎn)品能力點(diǎn),通常對于聯(lián)網(wǎng)能力的判斷,個(gè)人主要看搜索結果的完整度、全面性、時(shí)效性、準確性;
  4. 多模態(tài):多模態(tài)的能力主要包括跨模態(tài)的輸入和輸出,包括輸入方式上支持的格式類(lèi)型(文本、語(yǔ)音、圖片、文件、視頻等),以及輸出方式上的格式類(lèi)型;
  5. 垂直場(chǎng)景解決方案:也就是解決垂直場(chǎng)景的AI應用的解決能力,包括平臺提供的智能體、插件的能力,以及支持用戶(hù)定制智能體和插件的能力;

以下為個(gè)人對豆包及其核心競品核心能力的對比情況,其對比僅根據個(gè)人在過(guò)去將近1年的實(shí)際使用的感受獲得的結論,僅代表個(gè)人觀(guān)點(diǎn),如有不正確的地方歡迎指出,總結起來(lái)核心觀(guān)點(diǎn)主要如下:

  1. ChatGPT在文本生成的專(zhuān)業(yè)度、邏輯性,語(yǔ)音聊天能力體驗,多模態(tài)表現方面相比其競品做的都相對比較出色;但是在聯(lián)網(wǎng)搜索、插件和GPTs發(fā)展方面相對弱一些;
  2. 豆包在語(yǔ)音聊天,聯(lián)網(wǎng)搜索方面表現出色,但是在文本生成、多模態(tài)方面表現比Chatgpt、文心一言相比遜色一些;
  3. 文心一言在文本生成方面相比豆包更優(yōu)秀,但是語(yǔ)音聊天、聯(lián)網(wǎng)搜索表現略比豆包遜色一些;
  4. 三個(gè)產(chǎn)品在垂直場(chǎng)景的解決方案方面均沒(méi)有非常出色的表現;

8.2 終端布局對比

整體上,豆包在拓展終端,還有用戶(hù)使用入口這個(gè)事情上,做的更加激進(jìn),包括瀏覽器插件、電腦系統插件的植入,甚至據聞未來(lái)還計劃將產(chǎn)品能力拓展到抖音、頭條等產(chǎn)品;

8.3 底層大模型對比

對于模型的對比,站在使用端的角度上看,個(gè)人主要從模型基礎參數、模型綜合表現能力、價(jià)格這三個(gè)維度去做對,根據個(gè)人關(guān)注了解到的信息和評價(jià),對比GPT4.0、豆包大模型、文心大模型,個(gè)人評價(jià)如下:

  1. 在基本參數方面,從模型參數規模上看,目前GPT4.0的參數規模預計應該是最高的,其訓練數據規模個(gè)人猜測預計應該也是最高的,至于上下文長(cháng)度,目前大家基本豆包128k水平,至于目前市面上一堆生成百萬(wàn)、千萬(wàn)級的上下文,個(gè)人并不太理解為何能做到如此大的差異,其中可能有營(yíng)銷(xiāo)的嫌疑,但是個(gè)人比較相信GPT4.0的上下文長(cháng)度上限更加有代表性;
  2. 對于模型綜合表現方面,盡管目前國內有不少模型都生成達到或者超過(guò)GPT4.0的水平,但是從個(gè)人實(shí)際在應用接入的表現上看,GPT4.0的綜合表現基本遠遠超過(guò)國內所有模型;
  3. 價(jià)格方面,目前價(jià)格最低的模型是豆包大模型,今年5月份的時(shí)候其主力模型把輸出的價(jià)格下降了將近60倍,低至2元/百萬(wàn)token,這個(gè)對于行業(yè)應用的開(kāi)發(fā)者而言真的是一個(gè)福音,從個(gè)人的角度上看,GPT4o的價(jià)格雖然貴,但是能力和定價(jià)匹配,豆包大模型的能力和GPT4o能力有差異,但是性?xún)r(jià)比高,但是文心大模型的價(jià)格目前屬實(shí)太高,其定價(jià)基本對標GPT4o,站在開(kāi)發(fā)者的角度上看,性?xún)r(jià)比不高;

九、未來(lái)的產(chǎn)品發(fā)展方向思考

對于未來(lái)這款產(chǎn)品將會(huì )如何發(fā)展,個(gè)人認為,未來(lái)其發(fā)展應該會(huì )包含如下5個(gè)模塊:

  1. 核心應用場(chǎng)景能力升級和深化:除了底層大模型的同步發(fā)展之外,豆包在產(chǎn)品工程化方面個(gè)人認為后續會(huì )越來(lái)越深入,其中對于A(yíng)I目前在虛擬社交、搜索、內容創(chuàng )作、辦公、教育、生活助手等這些核心的應用場(chǎng)景的發(fā)展,后續會(huì )提供更多的功能升級和服務(wù);
  2. 智能體生態(tài)的發(fā)展:豆包將會(huì )重點(diǎn)發(fā)展第三方智能體生態(tài),其中關(guān)鍵的目標是孵化超級智能體,也就是使用量較高,并且能帶來(lái)更高的裂變效應和產(chǎn)品知名度的智能體;其次是如何將未來(lái)發(fā)展起來(lái)的智能體對外拓展和賦能,讓智能體的能力得到更多的使用;
  3. 多模態(tài)AI場(chǎng)景實(shí)現:目前豆包的大部分能力基本都是單模態(tài),未來(lái)隨著(zhù)多模態(tài)大模型的發(fā)展,相信產(chǎn)品也必將推出更多的多模態(tài)使用場(chǎng)景;
  4. 插件化:豆包的插件化主要是將豆包的產(chǎn)品能力拓展到更多的用戶(hù)使用場(chǎng)景,把產(chǎn)品能力接入到更多的終端和生態(tài),其中包括PC使用場(chǎng)景的插件化、應用插件化、硬件生態(tài)插件化,目前從產(chǎn)品的動(dòng)作和布局上,可以看到有這樣的傾向;
  5. 商業(yè)化:產(chǎn)品的商業(yè)化是必然會(huì )啟動(dòng)的,盡管目前產(chǎn)品是一個(gè)免費產(chǎn)品,但是目前產(chǎn)品昂貴的模型成本和研發(fā)成本,必然會(huì )push產(chǎn)品開(kāi)始探索商業(yè)化;

當然,以上內容均為個(gè)人基于對行業(yè)和產(chǎn)品的理解和經(jīng)驗的一些想法,并非實(shí)錘信息,僅供參考。

OK,至此,關(guān)于字節豆包的產(chǎn)品分析到此為止,寫(xiě)完以上內容之后,三白表示心情十分舒暢,作為一個(gè)非常不喜歡積累收藏零散、支離破碎的知識信息的強迫癥患者,每次系統輸出某一個(gè)產(chǎn)品的知識體系的時(shí)候,就好像把自己亂七八糟的房子重新收拾了一遍一樣干凈和舒服,我挺享受這樣的知識梳理的過(guò)程。

作者:三白有話(huà)說(shuō),公眾號:三白有話(huà)說(shuō)

本文由 @三白有話(huà)說(shuō) 原創(chuàng )發(fā)布于人人都是產(chǎn)品經(jīng)理。未經(jīng)作者許可,禁止轉載。

題圖來(lái)自字節豆包官網(wǎng)

該文觀(guān)點(diǎn)僅代表作者本人,人人都是產(chǎn)品經(jīng)理平臺僅提供信息存儲空間服務(wù)。

更多精彩內容,請關(guān)注人人都是產(chǎn)品經(jīng)理微信公眾號或下載App
評論
評論請登錄
  1. 寫(xiě)的很細,看完有所得

    來(lái)自廣東 回復
    1. 謝謝呀

      來(lái)自中國 回復
  2. 很驚訝競品選擇中沒(méi)有智譜清言,作為同期發(fā)布的競品,智譜清言不僅從模型質(zhì)量、自定義模型可配置程度、客戶(hù)端用戶(hù)體驗等層面上都強過(guò)豆包,可以說(shuō)從迭代功能上講豆包簡(jiǎn)直就是對智譜清言進(jìn)行拙劣模仿。居然還率先開(kāi)始商業(yè)化了,果然賣(mài)產(chǎn)品靠的不是產(chǎn)品能力,而是推廣能力。

    來(lái)自江西 回復
    1. 感謝同行專(zhuān)家的評論,一看就是在行的,基于您的觀(guān)點(diǎn)和問(wèn)題,回復如下:
      1.為什么競品里面沒(méi)有智譜清言?
      ①首先智譜清言確實(shí)也是競品之一,但是chatbot賽道的競品非常多,除此之外,還有天工、訊飛星火,甚至海外還有很多產(chǎn)品,筆者并沒(méi)有選擇一一完整的羅列,站在產(chǎn)品分析的角度,個(gè)人不太喜歡面面俱到,更傾向于聚焦重點(diǎn),所以跟個(gè)人寫(xiě)作的邏輯和風(fēng)格有關(guān);
      ②個(gè)人挑選聚焦重點(diǎn)競品的邏輯,核心是基于活躍規模,根據目前個(gè)人觀(guān)察到的數據,國內chatbot類(lèi)產(chǎn)品活躍前三的產(chǎn)品是文心一言、豆包、kimi,智譜清言在用戶(hù)規模上甚至還低于天工和訊飛星火,以上數據基于相對可靠的第三方平臺觀(guān)測數據;至于按照活躍規模挑選競品的邏輯是否有問(wèn)題,個(gè)人認為沒(méi)有問(wèn)題,即使是騰訊、阿里、字節內部,在選擇同賽道競品的時(shí)候,也會(huì )優(yōu)先看規模,其次看產(chǎn)品力;

      2.“迭代功能上講豆包簡(jiǎn)直就是對智譜清言進(jìn)行拙劣模仿”個(gè)人認為這句話(huà)“拙劣”一詞有些偏頗,不夠客觀(guān)
      從整個(gè)行業(yè)上看,大家都是在抄chatgpt,國內的產(chǎn)品算不上模仿和抄襲,也沒(méi)有必要,即使部分功能由于上線(xiàn)先后,存在學(xué)習模仿的嫌疑,行業(yè)內大家相互學(xué)習參考,沒(méi)啥問(wèn)題,算不上拙劣;至于模型、產(chǎn)品之間能力差異,個(gè)人認為,現在只有國內和國外的差異,國內的差異不值一提;

      3.“果然賣(mài)產(chǎn)品靠的不是產(chǎn)品能力,而是推廣能力”
      個(gè)人認為,商業(yè)層面的PK,自然是多個(gè)維度的,產(chǎn)品是很重要的維度,但是不能否認企業(yè)在流量獲客、品牌營(yíng)銷(xiāo)等方面的重要性,就好像海外的幾個(gè)頭部的模型,誰(shuí)敢說(shuō)GPT4就是遠遠比他們更好,但是大部分人第一個(gè)記住的是GPT4,不排除有奧特曼個(gè)人的營(yíng)銷(xiāo)能力在里面;純粹的產(chǎn)品思維,僅僅只是站在產(chǎn)品角度考慮問(wèn)題是不夠的,商業(yè)世界,要從商業(yè)的角度考慮問(wèn)題;

      最后,個(gè)人沒(méi)有貶低智譜清言的意思,不可否認它也是一個(gè)優(yōu)秀的產(chǎn)品,只是在我的邏輯之下沒(méi)有進(jìn)入觀(guān)測視角;另外對于不同產(chǎn)品的觀(guān)點(diǎn)和看法見(jiàn)仁見(jiàn)智,關(guān)鍵在于堅守自己的核心邏輯,同時(shí)給觀(guān)點(diǎn)要帶論據!

      來(lái)自廣東 回復