公司介紹
一、公司基本情況
星環科技是一家企業級大數據基礎軟件開發商,專注于打造世界領先的大數據基礎軟件。
大數據基礎軟件是應用系統最終實現數字化的技術基礎。公司作為大數據基礎軟件產品提供商,產品化程度較高,不局限于某一行業,可以快速在不同行業實現廣泛布局。公司自主研發的先進技術和大數據全周期解決方案能力成功滿足了各類客戶多個業務場景的需求,得到了眾多客戶的認可。此外,公司具備業界先進的大數據產品及持續創新能力,公司也是大數據基礎軟件國產化的重要推動者。
如果從三個切面來了解公司,可以簡括為A、B、C:
A即AI,主要包括TDS(Transwarp Data Studio)和Sophon(Transwarp Sophon)。TDS是星環大數據開發與治理一站式工具,支撐企業級數據治理和數據資產平臺建設。Sophon是星環智能分析工具軟件,能夠實現從數據到智能的全鏈路分析開發。此外,公司的Transwarp Infinity(星環無涯金融大模型)、Transwarp SoLar(星環求索大數據分析大模型)和Transwarp Sophon LLMOps(星環大模型開發工具)也在此中。
B即Big Data,主要包括TDH(Transwarp Data Hub,星環大數據基礎平臺)和Transwarp Database(星環分布式關系型數據庫)。我們常說的ArgoDB(星環分布式分析型數據庫軟件)和KunDB(星環分布式交易型數據庫軟件)即在其中,兩者能夠提供企業級的統一數據庫架構,同時滿足分析場景和交易場景。
C即Cloud,主要包括Transwarp Data Cloud(星環數據云平臺),是基于云原生技術打造的數據云,是可以支撐企業數字化轉型的PaaS平臺。
二、公司主要業務情況
公司具體主要提供兩大類的產品和服務:第一類是大數據基礎軟件業務,包含基礎軟件產品和技術服務;第二類是應用與解決方案,主要針對大數據應用場景,提供大數據存儲、處理以及分析等相關場景下的咨詢及定制開發等服務的解決方案;除上述兩類業務以外,公司根據客戶及項目需求銷售少量第三方軟件、硬件等其他業務。
從交付形式上,公司大數據與云基礎平臺、分布式關系型數據庫、數據開發與智能分析工具主要以軟件產品授權的方式交付,少量情況下根據客戶需求,公司提供軟硬一體交付方式。此外,根據部分項目具體需求,公司為大數據基礎軟件產品或相關的軟硬一體產品配套提供相關的技術服務,包括安裝部署、維保服務、產品升級、數據備份、技術培訓服務、遷移服務、平臺咨詢規劃、數據平臺建設、專家診斷與優化、技術開發服務、數據平臺運營等,以產品加服務的組合形式交付。因此,根據客戶對軟件、服務或硬件具體需求等不同,公司大數據基礎軟件業務的交付形式分為軟件產品授權、軟件產品授權及配套服務、軟硬一體產品、軟硬一體產品及服務四種交付形式。
三、公司主要客戶的行業分布
公司的產品目前已經在金融、政府、能源、交通、制造業等眾多國民經濟支柱行業得到廣泛應用。此外,大數據基礎軟件作為信息系統的重要基礎設施,對上層應用系統的穩定性、可擴展性等方面有重要影響,由于基礎軟件替換成本較高,已有客戶未來往往不會輕易替換已采購的產品,公司老客戶復購的收入也是公司營業收入的重要來源。
四、公司產品的迭代及國產替代中的情況
正常情況下,公司每年都要舉行技術峰會,其中將會發布公司最新的技術/產品。今年的“向星力?未來數據技術峰會”上,公司推出實現湖、倉、集一體化和多模架構的大數據基礎平臺TDH 9.3;能夠替代國外產品的分布式分析型數據庫ArgoDB 6.0、分布式交易型KunDB 3.2;構建海量數據互聯智慧“星”圖的分布式圖數據StellarDB 5.0;面向多元場景的高性能時序數據庫TimeLyre 9.1;提出六易、三倉、兩中心的新一代智能分析全流程平臺Sophon;數據要素流通產品Navier 3.1等產品。
公司產品的整個迭代過程中,公司自主研發的專有軟件占比也逐年提升。正是基于核心技術自主研發,在大數據基礎軟件國產化進程中,公司能夠得到更多機會。目前國內多家銀行、券商、基金等金融機構已采購公司產品及服務,公司已助力多個客戶實現了分析場景中部分關鍵系統的國產替代。
五、公司在AI大模型生命周期中的部分產品布局說明
(一)星環分布式向量數據庫(Transwarp Hippo)
分布式向量數據庫是一種專為高效存儲和處理向量數據設計的數據庫系統。自星環科技向量數據庫Transwarp Hippo發布,近期Transwarp Hippo1.1發布,一套系統即可支持向量與全文聯合檢索,可以提高文本數據的召回精度,從而提升大語言模型應用的準確率。Hippo1.1新增原生的余弦距離支持,簡化業務邏輯;批量數據導入導出,加速數據流轉;支持Explain與Profile,高效性能優化;支持ARM架構,滿足國產化需求。Hippo1.1多個新特征升級,以希望幫助用戶實現降本增效。
(二)大語言模型運營平臺(Sophon LLMOps)
在2023世界計算大會上,星環科技正式發布了全新的大模型運營管理軟件:Sophon LLMOps。
Sophon LLMOps作為星環科技自主研發的一款綜合性大模型統一運營管理平臺,旨在為用戶打通從數據接入、生成、開發和清洗、提示工程、大模型訓練、大模型上架部署到大模型應用編排和業務效果對齊的全鏈路流程,從而實現針對大模型的“數據和分析的持續提升”。
(三)星環求索大數據分析大模型(Transwarp SoLar)
大數據分析大模型SoLar“求索”是一款針對大數據行業全生命周期各種場景的大數據領域大模型。“求索”大模型具備大數據行業需求理解、推理、各類(含多模型)結構化查詢語言和代碼生成、文本生成、嵌入向量生成、知識推理等能力;用戶只需使用自然語言,就能利用“求索”大模型獲取所需的數據分析、展示和報告。
其應用價值,簡單來講,對于業務決策者,通過自然語言生成SQL,可以提高業務決策者的數據獲取能力,使其不再強依賴技術部門的ETL工作。對于數據分析人員,可以快速產出日常的數據報告,從而提高工作效率。
(四)星環無涯金融大模型(Transwarp Infinity)
針對量化投研領域特定的業務邏輯,星環科技通過預訓、提示、增強、推導范式的構建,實現Financial-Specific-LLM的訓練,推出了金融行業量化投研大模型無涯Infinity。星環科技基于大模型的事件驅動與深度圖引擎,實現對事件語義刻畫、定價因子挖掘、時序編碼、異構關系圖卷積傳播,進而構建包含事件沖擊、時序變化、截面聯動和決策博弈等多個維度的量化投研新范式。
(五)星環知識中臺(Transwarp Knowledge Studio)
星環知識中臺(TKS)可以針對政務、工業、能源等領域定制化應用場景,結合大語言模型技術,提供一站式、全流程解決方案。幫助客戶高效地創建業務場景并進行系統定制開發,提供知識構建、知識建模、知識問答系統構建等服務。
問答環節
1、數據要素資產的模式?
答:數據要素價值生成主要分為三個階段,數據資源化、數據資產化和數據資本化。
第一數據資源化。這個階段要做好數據治理與安全。這個環節要關注數據資源的整合、數據治理與產品運營以及數據安全與分類分級。
第二數據資產化。這個階段數據資產進入流通環節。這個環節的基礎設施組成部分主要包括了隱私計算、沙箱、數據產品的登記、跨域數據安全的管控等。
第三數據資本化。實現數據資產入表。這個環節目前比較新,星環也正在幫助企業做資產目標的時點,包括從數據資產識別、數據資產價值評估、數據資產登記到資產盤點與安全保護等一系列的工作。
2、公司的云基礎軟件實現什么樣的功能?
答:公司研發的基于容器技術開發的數據云平臺TDC,支持將大數據基礎平臺 TDH、分布式關系型數據庫 ArgoDB 和 KunDB 以及數據開發與智能分析工具 TDS 和Sophon 以云服務的方式提供給企業用戶,滿足大型企業對數據平臺的多租戶、彈性可擴展和使用靈活的需求。可以在一個云平臺上支撐大量的用戶需求和數字化應用,適用于建設大型企業的數字化基礎設施、城市大數據中心的數據平臺、企業級數據應用云以及跨多數據中心的數據平臺等場景。
以TDC的一個應用案例來說明,TDC 為上海市大數據資源平臺提供重要數據云計算環境。TDC 在上海市和區兩級政府的數字化建設中發揮了重要作用,被大量應用于“一網通辦”的核心系統中。基于 TDC 應用開發平臺的能力打造具備“高頻”“高并發”能力的數據接口服務,為“一網通辦”“隨申辦”等關鍵應用提供數據支撐,實現了“數據多跑腿、群眾少跑路”。
3、公司軟件產品是標準化的,如何理解標準化?
答:公司可以提供從標準化軟件授權到技術服務、軟硬件一體產品等多種模式的產品與服務,能夠為解決方案的制定提供更多靈活性。
4、公司產品的市場容量多大?
答:根據公司披露的《招股說明書》中沙利文研究的數據,中國大數據軟件市場由 2015 年的 52 億元增長至 2019 年的 146 億元,年復合增長率為 29.5%。伴隨著中國對數據運用重視程度日益提高,用戶對于大數據軟件采購預算增加趨勢明確,中國大數據軟件市場將在未來五年繼續保持高速增長,整體軟件市場規模將在 2024 年達到 492 億元,2019-2024 年復合增長率為 27.5%。
5、公司向量數據庫技術迭代怎么樣?
答:如前所述,星環科技向量數據庫Transwarp Hippo自發布已來,受到了眾多用戶的關注與歡迎,幫助用戶實現向量數據的存儲、管理和檢索,探索和實踐大模型場景。在與用戶不斷地深入交流以及實踐中,公司近期發布了Hippo1.1版本。
6、公司和英特爾的合作,是什么樣的合作?會有什么樣的結果?
答:近日,星環科技與英特爾發布AIGC向量數據庫聯合解決方案。該方案旨在支持多樣化機器學習模型生成的海量向量數據,滿足企業針對海量向量數據的高實時性查詢、檢索、召回等需求,為人工智能時代多元化應用場景提供有力支持,為企業業務加速發展提供助力。
希望通過軟硬件深度融合,實現了高性能、高經濟性、高擴展性的統一,滿足大模型時代海量、高維向量的存儲和計算需求,為用戶構建高性能向量數據庫系統和大語言模型場景提供更好的依據和選型方向。
7、公司人員數量
答:公司現在員工總數是1200人左右,預計未來的人員增長是降速的。其中后臺支持部門不會新增加員工數量,現在公司內部的ERP、BI、報告系統等都是自己研發,希望通過技術手段提質增效。
截至今年半年度,研發人員數量為407人。公司研發人員整體流動率穩定。