六月婷婷导航福利在线|国产日产欧产精品网站|欧美亚洲日韩国产综合网|亚洲中字幕永久在线观看|精品四虎免费观看国产高清|亚洲日本欧美一区二区三区|91国自产精品中文字幕亚洲|无码欧精品亚洲日韩一区app

首頁 > 宏觀 > 正文

當(dāng)前快看:拓爾思林松濤:發(fā)揮高質(zhì)量數(shù)據(jù)積淀優(yōu)勢 打通大模型落地關(guān)鍵路徑

2023-06-09 03:59:51來源:21世紀(jì)經(jīng)濟(jì)報道

6月6日,由21世紀(jì)經(jīng)濟(jì)報道、北京人工智能產(chǎn)業(yè)聯(lián)盟元宇宙專業(yè)委員會、中

21世紀(jì)經(jīng)濟(jì)報道記者雷晨 北京報道


【資料圖】

6月6日,由21世紀(jì)經(jīng)濟(jì)報道、北京人工智能產(chǎn)業(yè)聯(lián)盟元宇宙專業(yè)委員會、中國文化產(chǎn)業(yè)協(xié)會文化元宇宙專業(yè)委員會主辦的“21世紀(jì)卓越董事會人工智能閉門會”召開,主題為“AI領(lǐng)域上市公司創(chuàng)新涌現(xiàn)、技術(shù)難題與發(fā)展路徑”。

會上,拓爾思(300229.SZ)副總裁林松濤介紹了“拓天”大模型及行業(yè)應(yīng)用。他表示,大模型技術(shù)場景落地中的挑戰(zhàn),主要是質(zhì)量、可控、時效和成本。

質(zhì)量方面,他認(rèn)為,個人服務(wù)用ChatGPT,提示詞不準(zhǔn)可以換一個,如果圖片生成不好也可以再換一個,可以說個人對AIGC的容忍度是很高的。但是企業(yè)不一樣,給政府寫顧問報告,數(shù)據(jù)來源必須是準(zhǔn)確的。

可控層面,一是內(nèi)容安全,數(shù)據(jù)是有價值觀的,模型沒有價值觀。二是私域數(shù)據(jù)安全,中國大模型要數(shù)據(jù)化落地,如何在保證用戶私有數(shù)據(jù)安全的同時將大數(shù)據(jù)較好地運用也是一個問題。

時效方面,在大數(shù)據(jù)訓(xùn)練上,災(zāi)難性的遺忘一直都是訓(xùn)練的問題,所以需要大模型解決這個問題。另外,怎樣輸入即時數(shù)據(jù),類似Chat GPT,數(shù)據(jù)最新只到2021年9月,因此在To B服務(wù)的時候用不好。

成本方面,千億模型私有化落地的時候需要訓(xùn)練好,在企業(yè)端落地還需要讓企業(yè)用得起。拓爾思做To B服務(wù),垂直場景落地成為“百模大戰(zhàn)”的核心要點。

據(jù)林松濤介紹,大模型出來以后顛覆了拓爾思此前積累的NLP技術(shù),公司發(fā)現(xiàn),在大模型的基礎(chǔ)上再去結(jié)合知識圖譜、自然語言處理技術(shù)效果更好。與此同時,公司擁有長期數(shù)據(jù)采集和高質(zhì)量數(shù)據(jù)資產(chǎn)積累優(yōu)勢,可將數(shù)據(jù)迅速投入到大模型當(dāng)中。

“現(xiàn)在拓爾思擁有全網(wǎng)數(shù)據(jù)1500億,有人工整理、專家整理的數(shù)據(jù)庫達(dá)30多個,主題數(shù)據(jù)110億個,這是拓爾思能夠做大模型很重要的優(yōu)勢?!?/strong>林松濤稱。

據(jù)了解,拓爾思在大模型應(yīng)用方面首先選擇政府、媒體和金融三個優(yōu)勢賽道。

在林松濤看來,做垂直領(lǐng)域首先要選好大模型基座,國內(nèi)頭部廠商自己做基座,也有一些廠商選擇開源,同時還需要有數(shù)據(jù)以及在專業(yè)領(lǐng)域的積累,最后在大模型落地時,不僅要有技術(shù)、數(shù)據(jù)、還需要讓用戶知道如何應(yīng)用,包括真實場景的閉環(huán)、基于用戶反饋的學(xué)習(xí)等等。

“我們現(xiàn)在要解決的三個問題,一是實現(xiàn)大模型與專業(yè)知識庫的融合。二是如何提升AIGC的內(nèi)容質(zhì)量和數(shù)據(jù)安全,特別是在內(nèi)容事實核查方面。三是如何降低百億級大模型落地的成本?!?/strong>林松濤表示。

關(guān)鍵詞:

責(zé)任編輯:hnmd004

最新資訊