一、公司高級管理人員施水才先生、李黨生先生就公司業務發展情況、近期經營情況及未來戰略規劃進行介紹。
二、參會機構提問及回答
(一)隨著國內廠商陸續推出大模型,未來是否會有更多的企業具備研發大模型的能力,是否會給公司帶來挑戰,公司的優勢集中在哪些方面?
回答:公司密切關注行業動態及產業政策,目前國內、國外眾多廠商都在研發、構建通用大模型,主要圍繞基座大模型的內容生成,多輪對話、語義理解和多模態交互等主要功能的展示和試用,但是我們認為大模型的方向應該是場景落地、私有化部署、價值觀對齊和數據安全、業務系統的集成和形成閉環以及性價比都是場景落地過程中要解決的關鍵問題。要把通用大模型變成專業大模型,需要解決大模型和知識庫的結合,提升內容生成質量和數據安全性等關鍵問題。拓天大模型(以下簡稱拓天)的主要優勢是具有海量全域的實時數據能力,多模態大模型的聯調能力,拓天在基座數據擴充、增量預訓練、指令微調、插件增強等方面都做了大量的研發工作,形成了面向政務的拓天G、面向媒體的拓天M和面向金融的拓天F三大專業模型。大規模優質數據資產和AI工程化落地能力是拓爾思核心優勢。
在數據資產和行業知識資產方面。公司自2010年自建大數據中心,擁有3大專業IDC機房,已積累數據總量超1400億條,每日新增數據量高達1億多條,秒級采集更新。并且,公司擁有30+大類通用、行業/領域知識庫;31000+標簽規則;100+通用NLP和300+行業/領域深度學習算法模型的模型工廠等,可面向不同行業、不同落地場景對數據進行知識模型的加工。
(二)公司在媒體行業的市場份額較高,未來如何繼續打開增量市場空間?
回答:媒體行業以及融媒體解決方案是公司成熟業務版塊,業務主要以“軟件產品+大數據服務”的融合模式為客戶提供服務,用戶已經覆蓋了72%的中央媒體,61%的省級媒體,40%的行業媒體。目前,公司融媒體用戶主要統計范圍為體制內單位。
在業務展望方面,公司正在全力加速拓天大模型及AIGC產品的研發工作,媒體行業的AIGC應用包括內容生產智能助手、以文生圖、新一代搜索和推薦、多模態傳播和服務等主要功能。以文生圖的應用場景主要面向媒體從業者提供稿件AI配圖服務。系統根據文字描述,AI自動生成完整的繪畫作品,支持寫實、照片、國畫、水彩、素描、科幻、素描、油畫、卡通等風格。目標客戶為3398家主流新聞媒體(不含互聯網新聞平臺)。知識搜索和輔助寫作的應用場景基于公司自有的千億級官媒、主流媒體、自媒體等新聞資訊數據,面向媒體、智庫等從業者提供高質量的新聞資訊類知識型搜索服務,支持對話內容自動生圖,支持輔助新聞寫稿。目標客戶為3398家主流新聞媒體(不含互聯網新聞平臺)、403家國內外主流智庫。公司在融媒體領域的優勢地位正在擴展到央企和政務等增強市場,形成媒體+服務的泛行業服務。
(三)公司在向量數據庫方面是否有投入?
回答:公司緊跟技術發展新趨勢,在向量數據庫方面已有布局并投入了研發力量,目前已經形成了技術積累。公司TRS海貝搜索數據庫計劃引入向量數據的支持能力,目前已經完成核心功能的開發,正處于內測階段。
(四)在同一個行業內,不同客戶的需求是否會有很大差異?
回答:目前,公司同行業客戶之間的需求差異不會很大,80%是共性的,20%需要定制開發,定制化比例較小。公司通過多年的行業經驗積累,已充分歸集行業客戶需求共性,競爭優勢體現在具備專業領域的經驗積累以及為客戶實現業務閉環能力。在具備成長性的金融科技版塊,公司主要面向銀行業金融機構提供智能風控、智能消保、普惠助貸、綠色金融等金融科技領域的軟件產品及數據服務。例如,智能消保管控中臺面向銀行業消保、業務部門,打通各業務系統消保數據,從非結構化投訴數據挖掘相關知識并分析應用,實現對各渠道消保數據的科學精細化管理。截至2022年末,公司智能風控業務的用戶已經覆蓋了5大國有銀行、3大政策性銀行、50%的股份制商業銀行。
(五)公司海貝搜索數據庫的優勢和強項主要體現在哪些方面?
回答:公司“TRS海貝搜索數據庫”(以下簡稱“海貝”)是一款從內核到系統完全國產自研的搜索型數據庫,匯聚了公司在大數據搜索引擎和自然語言智能處理領域多年的技術積累,補足了開源檢索系統欠缺的企業級功能,可快速有效地管理、檢索和分析大數據,賦能組織機構成功數字化轉型。
海貝和ElasticSearch都是技術非常優秀的大數據檢索系統,但兩個系統在定位上存在一定的差異。作為開源軟件,ElasticSearch的總體架構更加開放,主要面向大數據系統開發使用,需要具備較高技術資質和技術儲備的人員才能掌握;海貝作為一款企業級產品,為支撐上層應用的快速開發,應用功能集成度更高,而且直接提供更多企業級特性,更加簡單易用,方便用于大數據應用和系統集成項目中。
海貝最主要的創新點之一是面向自然語言和非結構數據的一體化檢索引擎,其采用單一分詞器覆蓋全語種分詞,而且除了文本以外不僅支持數字、日期等常用格式的搜索,也支持地理位置信息、圖像、二進制文件等多種數據格式的搜索;系統利用基于深度學習的基因編碼計算技術,從訓練得到的深度神經網絡模型中提取深度圖像特征,利用深度基因編碼和倒排索引技術構建圖文混合索引,不僅可以實現圖像檢索,還可以實現圖像和文本一起混合檢索,從而進一步提高系統檢索的精度。效率方面,以搜索為核心構建的海貝,通過倒排索引技術,可以在PB級別的數據里實現毫秒級響應,主要解決大數據場景下海量非結構化數據的存儲、檢索、統計問題,為用戶在海量數據里快速挖掘有價值的信息提供技術支撐。
(六)公司在對話式AI產品方面的水平如何?
回答:2023年5月,中國信息通信研究院正式公布首輪對話式AI專項評測結果,公司成為業界首批通過評測的科技企業,自主研發的智能問答云服務系統——TRS小思智能問答機器人系統(以下簡稱“TRS小思”)順利通過對話功能模塊評測。TRS小思以豐富全面的知識庫、準確快速的回答效果及流暢穩定的交互體驗等產品亮點通過對話式AI專項評測,被評估為功能完備度較高的對話式AI產品。
公司以數據智能應用為核心,賦能政府、媒體、金融等行業的數字化轉型,在對話式AI領域已聯合行業客戶相繼打造出一批優秀實踐案例。政府網站辦事問答機器人主要客戶包括水利部、中國氣象局、天津市政府、廣州市政府以及南寧市政府等。國家標準相關知識問答機器人,艾滋病防治-小艾問答機器人,審計知識問答機器人和外國人來華求學、投資、旅游相關領域辦事問答機器人分別服務于中國標準化研究院、人民衛生出版社、時代經濟出版社和中國日報社。
(七)公司大股東近期是否有減持意向?
回答:截至目前,公司尚未接到持股5%以上股東的減持意向或計劃,相關情況請及時關注公司公開披露的公告內容。