訂閱
                      糾錯
                      加入自媒體

                      百家中國數據庫企業僅3家千人規模,如今一家要上市

                      2022-07-08 17:20
                      數智前線
                      關注

                      中國占到全球數據庫技術人員的1/5,即2萬人左右,平均到中國116家企業,平均每家不足175人,其中有3個國產數據庫達到千人以上規模,分別是阿里、華為和達夢。如今達夢已提交IPO。

                      文|周路平 趙艷秋

                      編|王飛飛

                      6月底,在一場國產數據庫小型會議上,信通院人士公布了數據庫研究報告的部分內容,其中有幾個有意思的數據:

                      全球數據庫企業目前有363家,以中美為主,總計占全球71%,其中美國145家,中國116家。全球數據庫領域的技術人員超過10萬人,平均每家員工數量不到300人。中國占到全球技術人員的1/5,也就是2萬人左右,平均每家不足175人,其中有3家國產數據庫企業達到1000人到2000人的規模,也有一些企業員工數不到5人。相比之下,美國數據庫企業甲骨文,有數萬人。

                      由于信通院未公布中國3家千人以上數據庫企業的名字,這也引發了業內的好奇。而數智前線通過業內人士了解到,阿里和華為規模都超過了千人,第三家是誰存在爭議。

                      數智前線根據達夢的招股書以及之前的資料發現,武漢達夢數據庫的規模在2021年突破了千人。這家企業是第一批國產數據庫的代表,被譽為國產數據庫“四朵金花”之一。

                      目前,四朵金花里的其他三家都還沒有資本方面的動作,而人大金倉在太極股份旗下,也沒有明確的上市計劃。如果達夢成功上市,將成為國產數據庫的第一股。

                      不過,盡管頂著第一股的光環,但達夢是否能撐得起此前券商給出的500億元估值,以及達夢數據庫的內核是否真的完全自主可控,依然存在一些爭議。

                      01

                      500億市值,值不值?

                      先看一下估值的爭議,此前有券商認為達夢市值有望突破500億元人民幣,而這一判斷的主要邏輯非常簡單,2021年達夢的凈利潤為4.38億元,如果按照100倍左右的PE(市盈率,PE=公司市值/公司凈利潤)計算,市值就能到500億元左右。

                      100倍的PE值是怎么得出來的?券商參考的是國產工業軟件第一股中望軟件,以及替代了Office的金山軟件,他們作為國產替代的代表軟件公司,有一定的參考價值。而后兩家公司的PE都在100倍左右。其中,國產CAD第一股的中望軟件,去年的凈利潤1.82億元,如今的市值為169億元,PE值為108。

                      所以,市場認為,達夢也應該有百倍的PE。而且相比于工業軟件和辦公軟件,數據庫在這幾年得到的支持明顯更大。不過,影響這個算法的另一因素是凈利潤,達夢在上市前夕,業績大幅攀升。

                      從2019到2021年,達夢的業績增長非常迅猛,分別實現營業收入3.01億元、4.5億元、7.43億元,同期凈利潤則分別為8374.6萬元、1.44億元、4.38億元,同比增速分別為71%、204%。尤其是2021年,凈利潤率超過了50%。

                      但作為四朵金花之一的人大金倉 ,其2021年的營收為3.4億元,而凈利潤也只有3129萬元。為何差距這么大?

                      首先,達夢營收增長受到了大環境的影響。其客戶主要集中能源、金融、政府領域。這幾個領域又是價值較高、自主創新的領域。

                      比如今年年初,銀保監會印發指導意見,強調“對業務經營發展有重大影響的關鍵平臺、關鍵組件以及關鍵信息基礎設施要形成自主研發能力,降低外部依賴”,自主創新的基礎軟硬件在IT外采中占比要求有望提高至15%-25%。

                      而達夢的股東背景也給了它非常大的便利,達夢在2008年引入中國軟件作為其大股東。

                      不過,政企的項目往往存在比較長的賬期。2021年,達夢的營收增速為65%,但其應收款增速達到了125%。也就是說,業績確實在高速增長,但換來的是一堆應收款。

                      國產替代的需求帶來了營收高增長,而凈利潤的飆升,則受到了兩個非業務因素的影響:一個是稅收優惠,光2021年稅收返還及優惠政策所涉及的金額就達到了1.12億元,占營業收入比重為15.08%。

                      另一個是政府補助。數據庫作為國家大力支持的“核高基”項目,支持力度較高。而達夢在2021年計入當期損益的政府補助金額為1.31億元,占同期凈利的29.95%。

                      這兩項都不具備持續性。所以說,100倍的PE值以目前的市場情緒是可以達到的,但達夢的凈利潤能否一直保持就很難說了,以目前如此高的凈利潤來計算估值,并不是非常合理。

                      參見上市的芯片企業,芯片的熱度一定程度上要高于數據庫,前兩年上市的芯片公司,PE值有的高達200~300倍,有芯片資深人士曾告訴數智前線,PE值在60倍左右是合理的。但如今,很多芯片公司的PE值已回歸30倍左右。

                      02

                      到底是不是完全自主可控?

                      數據庫作為卡脖子的技術之一,其底層能否自主可控一直是外界最為關心的話題。

                      當達夢提交IPO后,業內有一個討論是,達夢數據庫是不是完全自主知識產權的。也就是說,達夢的代碼是自己寫的,還是借鑒了某個開源數據庫?

                      這樣的質疑背后有一定的原因,中國的數據庫大部分是基于開源技術開發的,自己研發的少之又少。而開源是否為自主知識產權,國家還沒有一個明確的定義。特別是以海外主導的開源技術和社區,最近幾年出現過一些問題,讓基于開源的產品,面臨一定風險。

                      信通院最近給出了一組數字,美國開源和商業數據庫的占比為48%和52%,在我國是16.6%和83.4%。具體到數量,美國開源數據庫為107個,商用數據庫產品116個,比較均衡;但中國開源數據庫為146,商用數據庫僅為29個。

                      信通院稱,國內外的商業和開源數據庫的數量和種類差異比較顯著,這也意味著我國數據庫技術上整體還存在一定的差距。

                      值得關注的是,達夢從始自終都強調自己的數據庫產品,源代碼是自主開發,而不是像絕大多數國產數據庫一樣,基于開源開發。當時包括人大金倉在內的國產數據庫,底層都是基于開源的PostgreSQL。

                      而在最新的達夢招股書中也明確寫道:歷經20年的發展,達夢已掌握數據管理與數據分析領域的核心前沿技術,達夢擁有全部源代碼,具有完全自主知識產權,自主原創率達99.9%。

                      “達夢在近30年的技術積累基礎上,投入上千人力,投資過億,開發源代碼數千萬行才形成了今天的產品,每行代碼都是我們自己的研發隊伍寫出來的。”2010年,馮裕才就對采訪他的媒體說。

                      不過,公眾號“飛總聊IT”提到,在某個大牛云集的地方,大家討論過達夢數據庫,一個說法是它們數據庫是基于某個很早期的PostgreSQL版本魔改的。也有留言稱,不是PostgreSQL版本,而是MySQL。

                      但達夢高級副總裁付銓曾告訴我們,達夢在一些大項目中之所以能夠獲得訂單,最根本的一條是自己掌握核心技術。

                      他解釋說,達夢做了這么多年的兼容甲骨文數據庫,甲骨文的功能非常多,是百萬級別的。“代碼是自己的,你才能夠做很多的修改和調整。用開源數據庫,它的架構都已經定了,你沒有把它吃透的話,遇到問題是搞不定的。”他說,達夢因為代碼都是自己寫的,能夠很快解決問題。

                      早在2013年4月,達夢數據庫獲得由中國信息安全測評中心頒發的《信息技術產品自主原創測評證書》,成為國內第一家獲得“信息技術產品自主原創測評證書”的數據庫安全產品。

                      付銓也提到開源做數據庫的問題,他當時說達夢沒有考慮基于開源研發數據庫,原因是目前他們覺得知識產權的保護上可能做得不是太夠。很多技術一旦開源了,要遵循開源的協議,你要去用它的開源的東西,同時,你修改的東西也應該要公開。所以,雖然注意到開源發展很快,但達夢還沒有考慮這一塊。

                      “首先,對開源引領的技術方向要認真的研究;其次,對開源代碼要采取謹慎的態度。在別人的地上蓋房子種莊稼,當人家把地收回去時,房子莊稼就都不存在了。”馮裕才做過這樣的表述。他甚至把開源免費看成是上癮的鴉片,終有一天要為此付出沉重的代價。

                      具體到達夢的核心技術,要做到兼容甲骨文,一個關鍵是要具備甲骨文類似的共享存儲集群。這也是甲骨文拿下中國通信和金融市場的一個核心技術。付銓說,達夢在2013年左右開始做這個類似的共享存儲集群,是在達夢6.0版,但這個版本的架構有一些問題,最后試驗評估下是走不通的,由此,達夢重新設計了體系架構,做了7.0,而真正到達夢8.0才做成了共享存儲系統,到2021年才算是產品化,“這個東西是很難的”。

                      付銓稱,兩三年甚至更早的時候,達夢隨一些國內合作伙伴出海,產品用到了東南亞的泰國,也到了南美、非洲的,甚至還有俄羅斯。“這兩年要少一點,這跟疫情也有關系。”

                      而在業內人士看來,如果有知識產權問題,大概率是不太敢出海的。

                      飛總也稱,“目前網上說達夢是PostgreSQ改的,并且能夠展示出來比較信服的證據,我還是真的沒看到。這讓我想起了另外一家說自己也是全自研,但是很多證據都揭示是基于PostgreSQ改的公司,兩個一對比,目前來說,我也很難說達夢不是自研。”

                      03

                      國產數據庫是熬出來的

                      國產數據庫“四朵金花”里,人大金倉成立的時間最早,在1999年由人大教授王珊牽頭成立,她也是國內數據庫學科奠基人薩師煊的弟子。達夢正式成立的時間是2000年,創辦人馮裕才當時是華中科技大學的教授。而南大通用是南開大學的背景,神舟通用則是中國航天和浙江大學支持的項目。

                      不難發現,最早一批成立的數據庫公司多與大學或者科研院所有關,都是學者教授在將科研攻關成果轉化為市場產品。但這些從高校或者科研院所孵化出的項目,在早期并沒有太大成功,背后有自身技術的不足,當然也有市場不夠支持的因素。

                      馮裕才曾回憶,他為了推廣數據庫,去拜訪過近千家國內企業,感興趣者寥寥。背后主要是國產數據庫與海外的產品差距太大,國內的數據庫市場基本由三座大山壓住了:IBM、甲骨文和微軟。

                      不過,令人欣慰的是,付銓回憶,從2013年左右開始,市場開始推動國產數據庫。大家越來越深刻地意識到自主可控的重要性,國內企業開始嘗試把更多機會和訂單給到國產技術和產品。

                      早在2008年,由于國家電網與甲骨文在采購價格、后期服務費上沒有談攏, 時任國家電網的總工提出,要了解國產數據庫,達夢有機會進入國家電網測試, 并在沒有抱太大希望的情況下,達夢逐步進入國家電網調度系統。到目前,國家電網調度領域所有數據基本都國產化了。這也是達夢最大的客戶之一。

                      2013年斯諾登事件后,達夢開始進入民航領域,并在民航訂票系統的數據庫落地過程中,使用了柔性替代方案,即達夢數據庫與海外數據庫并行一段時間,再切換到達夢數據庫上。這個方法也是當年各領域國產企業替代海外產品的做法。此后,達夢進入中國人壽、中國移動等項目中。

                      達夢的最大特色是與美國甲骨文兼容,這個兼容性的開發,是一個長期的過程,達夢到現在已經做了十四五年。去年6月,達夢稱與甲骨文兼容的程度,籠統的說可能到了95%以上。這也是達夢獲得很多大型企業訂單的原因。曾有一位客戶反饋,用達夢替代甲骨文后,他們上層的應用都不用改寫,這是企業最為看重的地方。

                      在經歷了中興華為事件之后,國產化在數據庫等關鍵領域被更加重視,支持力度前所未有。比如2020年被認為是啟動金融試點的元年,國內頭部的銀行、保險、證券、期貨、支付金融機構開啟了一定比例的自主產品采購。

                      不過,金融系統由于對業務穩定性要求高,此前一直是國產數據庫最難替換的行業。所以,諸如銀行的交易系統大多用的依然是甲骨文的方案,國產數據庫更多在一些非核心系統上使用。

                      根據國際數據公司(IDC)的統計,截至2019年,在傳統部署的關系型數據庫市場,甲骨文的甲骨文數據庫在中國占有的市場份額為34.7%:在金融、電信等高端專業領域,甲骨文數據庫占有的市場份額高達98%。

                      但即便在金融行業,國產數據庫與并非沒有進展。2019年,湖北銀行成了達夢數據庫在銀行領域的第一個客戶。而螞蟻集團的OceanBase和騰訊的TDSQL都拿下了數個銀行核心數據庫的訂單。

                      一位資深數據庫人士對數智前線說:“三年之內,中國城商行的國產替換完全有可能。”

                      如今,國產數據庫從之前的荒草叢生,現在已是百花齊放。

                      除了傳統數據庫廠商(人大金倉、達夢、神舟通用、南大通用等),也有大廠的“云數據庫”(阿里云、騰訊云等),還有新興數據庫,比如PingCAP的通用數據庫TiDB,濤思數據的時序數據庫TDengine、歐若數網的圖數據庫Nebula Graph。此外還有巨杉、中興、浪潮、易鯨捷等的數據庫產品,都登上了國內外流行度榜單。

                      在市場方面,2021年,中國數據庫市場是47億美元,占全球的5.2%。而從IT支出來說,中國占全球的15%,數據庫這個領域的市場增長有較大空間。

                      多方面因素之下,國產數據庫,也許很快就要熬出頭了

                             原文標題 : 百家中國數據庫企業僅3家千人規模,如今一家要上市

                      聲明: 本文由入駐維科號的作者撰寫,觀點僅代表作者本人,不代表OFweek立場。如有侵權或其他問題,請聯系舉報。

                      發表評論

                      0條評論,0人參與

                      請輸入評論內容...

                      請輸入評論/評論長度6~500個字

                      您提交的評論過于頻繁,請輸入驗證碼繼續

                      暫無評論

                      暫無評論

                      人工智能 獵頭職位 更多
                      掃碼關注公眾號
                      OFweek人工智能網
                      獲取更多精彩內容
                      文章糾錯
                      x
                      *文字標題:
                      *糾錯內容:
                      聯系郵箱:
                      *驗 證 碼:

                      粵公網安備 44030502002758號

                      厕所偷窥拉屎WCpeeingtube