
來源頭條作者:數據學習DataLearner最近幾年,數據的重要性在各個領域都獲得了巨大的重視。因此,數據管理相關的業務也成為各項基礎設施中增長最快的業務,目前的市場規模約700億美元,占所有企業的基礎設施支持約1/5。僅在2021年,數據處理相關的公司獲得了數百億的風險投資。為此,Future總結了2022年全球最大的50家數據創業企業。這里我們列舉其中的最大的10個進行介紹。一、Databricks二、FiveTran三、Scale AI四、OneTrust五、Collibra六、dbt Labs七、Starburst八、Dremio九、Dataiku十、Hugging Face總結一、DatabricksDatabricks起源于學術界和開源社區,由Apache Spark?、Delta Lake和MLflow的原創作者于2013年創立。作為世界上第一個也是唯一一個云端的lakehouse平臺,Databricks結合了數據倉庫和數據湖的優點,為數據和人工智能提供一個開放和統一的平臺。它們是一家數據+AI的企業。企業類型:數據查詢和處理所屬地區:美國(San Francisco, CA)估值范圍:50+億美元官網地址:https://databricks.com/二、FiveTran作為自動化數據集成的領導者,Fivetran提供ready-to-use connectors,可自動適應模式和API的變化,確保對數據的一致、可靠訪問。Fivetran通過不斷地將數據從源應用程序同步到任何目的地,提高了數據驅動決策的準確性,使分析人員能夠使用最新鮮的數據。為了加速分析,Fivetran自動進行倉庫內的轉換,并以編程方式管理隨時可以查詢的模式。企業類型:ELT和數據編排所屬地區:美國(Oakland, CA)估值范圍:50+億美元官網地址:https://www.fivetran.com/三、Scale AIScale AI是一家位于舊金山的初創公司,專門幫助企業為人工智能應用標注和整理數據。更好的數據帶來了更多的性能模型。高性能的模型導致更快的部署。這家企業通過提供一個端到端的解決方案來管理整個ML生命周期,幫助以更好的數據更快地實現人工智能投資的價值。企業類型:人工智能和機器學習所屬地區:美國(Palo Alto, CA)估值范圍:50+億美元官網地址:https://scale.com/四、OneTrustOneTrust是Inc. 500強中增長最快的公司。它最主要的業務就是識別數據中的隱私風險。它可以幫助企業自動評估隱私影響并管理控制相關的活動。其主要目標是定義企業平臺,以實現“信任”的運作。超過12000個客戶,包括財富100強中的75%,使用OneTrust使“信任”成為競爭的差異化因素,在隱私、安全、數據治理、GRC、第三方風險、道德與合規以及ESG項目中實施中央敏捷工作流程。企業類型:數據治理和安全所屬地區:美國(Atlanta, GA)估值范圍:50+億美元官網地址:https://www.onetrust.com/五、CollibraCollibra消除了數據管理的復雜性,使您在強大的分析能力和易用性之間獲得完美的平衡。Collibra的平臺解鎖你的數據,以解決問題,實施想法和發展你的業務。全球有500多家客戶使用這家企業的數據智能云平臺,在他們的數據中尋找意義并加強他們的決策。包括數據目錄、治理、脈絡、質量和隱私解決方案等,都是該平臺的能力。企業類型:數據治理和安全所屬地區:比利時(Brussels)估值范圍:50+億美元官網地址:https://www.collibra.com/us/en六、dbt Labsdbt?是一個轉換工作流程,讓團隊能夠按照軟件工程的最佳實踐,如模塊化、可移植性、CI/CD和文檔,快速和協作地部署分析代碼?,F在,任何懂得SQL的人都可以建立生產級的數據管道。dbt Labs的使命是幫助分析人員創造和傳播組織知識。在開創了分析工程的實踐后,這家企業支持了一個由超過25000名數據從業者組成的社區,致力于改變數據團隊的合作方式。企業類型:ELT和數據編排所屬地區:美國(Philadelphia, PA)估值范圍:10-50億美元官網地址:https://www.getdbt.com/七、StarburstStarburst的使命一直專注于解決數據訪問的痛苦—它太慢、不靈活和昂貴。Starburst提供了一個現代化的解決方案,解決這些數據孤島和訪問速度的問題。它幫助企業利用開源的Trino—當今最快的分布式分析引擎的價值,增加連接器、安全性和24×7支持,以滿足大規??焖贁祿L問的需求。企業類型:數據查詢和處理所屬地區:美國(Boston, MA)估值范圍:10-50億美元官網地址:https://www.starburst.io/八、DremioDremio將獲得洞察力的時間從幾周縮短到幾分鐘,簡化了數據工程,并使你的數據架構面向未來。它們提供了更好的BI體驗,簡化了數據工程,并且保持最新的架構。Dremio提供了一個幾乎是自助式的數據平臺,允許你從多個來源創建虛擬數據集,并作為一個只讀數據庫,同時還為現代數據可視化工具提供簡單的配置,如Tableau、Power BI、Qlik Sense等。企業類型:數據查詢和處理所屬地區:美國(Santa Clara, CA)估值范圍:10-50億美元官網地址:https://www.dremio.com/九、DataikuDataiku成立于2013年,其原則是為了在世界快速發展的數據生態系統中取得成功。今天,全球有超過450家公司使用Dataiku來系統化地使用數據和人工智能,推動了從欺詐檢測到客戶流失預防、從預測性維護到供應鏈優化等各種不同的使用案例。企業類型:數據查詢和處理所屬地區:美國(New York, NY)估值范圍:10-50億美元官網地址:https://www.dataiku.com/十、Hugging FaceHugging Face是一家非?;钴S的人工智能創業公司。它擁有一個非常強大并且活躍的人工智能社區。有超過5000多家機構都在Hugging Face的社區發布內容,包括Google AI、Facebook AI、微軟等。自從2016年成立以來,這家企業經歷了5輪融資,總共募集了6000萬美金。Hugging Face在人工智能領域的影響力很大,運營著很大的一個社區。它的成長轉變也是因為貢獻了基于pytorch的bert而發生了很大的變化。目前,它們的社區非?;钴S,也在持續地貢獻優秀的產品。像他們提供的transformers、tokenizers、datasets、accelerate庫都對NLP相關的實踐產生了很大的促進。此外,各大公司在它的社區的貢獻和支持,也讓這家企業的社區更加活躍和健康。這家企業,我們也曾經有過介紹:人工智能初創企業Hugging Face是什么樣的企業——HuggingFace簡介 | 數據學習者官方網站(Datalearner)企業類型:人工智能和機器學習所屬地區:美國(New York, NY)估值范圍:2.5-10億美元官網地址:https://huggingface.co/總結關于數據處理的業務目前的確增長非常迅速,即便是大型科技企業,也不可能所有環節都自研。同時,為了保持生態的繁榮和互相的兼容,也會支持一些新的創業公司開展自己的業務。而目前,這部分創業公司中,國內大多數專注于應用,真正能基于開源技術或者基礎技術做出貢獻的依然還是比較少的。希望未來這方面能有所變化。原文詳情:2022年全球最大的10家數據處理相關的創業公司 | 數據學習者官方網站(Datalearner)
暫時沒有評論,來搶沙發吧~