“Dữ liệu là dầu mỏ mới”, câu nói được nhà khoa học dữ liệu người Anh Clive Humby nghĩ ra vào năm 2006, chỉ trở nên phổ biến trong vài năm trở lại đây nhờ sự bùng nổ của AI tạo sinh.
Nhưng nếu đúng như vậy, tại sao bạn không thể mua và bán dữ liệu dễ dàng như bạn có thể mua và bán các thùng dầu thô, vì đây là hàng hóa mà rất nhiều công ty và mọi người quan niệm? Thay vào đó, chúng ta đang trải qua nhiều năm đấu tranh tại tòa án và các bài viết được báo cáo đầy đủ ghi lại cách các nhà cung cấp AI (cùng với các công ty khác) đã thu thập dữ liệu trên web mà không quan tâm đến bản quyền và có khả năng vi phạm.
Liệu có nên có một “điểm dừng chân duy nhất” cho các công ty để mua dữ liệu sạch, được cấp phép đầy đủ và sử dụng dữ liệu đó để hỗ trợ cho các mô hình kinh doanh và ứng dụng của họ hay không — một dạng iTunes dành cho dữ liệu hoặc Amazon dành cho dữ liệu?
Đó là suy nghĩ đằng sau Carbon Arc , một công ty khởi nghiệp mới nổi lên từ giai đoạn ẩn dật ngày nay với 55 triệu đô la tiền tài trợ hạt giống do Liberty City Ventures dẫn đầu. K5 Global, Raptor Group, Wasserman Media Group, AI Data Utility và Real-time Insights Exchange cũng tham gia vào vòng tài trợ này.
Nó được thiết kế để giúp các doanh nghiệp sử dụng, giao dịch và tích hợp thông tin tình báo có cấu trúc mà không gặp phải tình trạng kém hiệu quả của việc thu thập dữ liệu theo cách truyền thống.
Công ty được thành lập vào tháng 3 năm 2021 với một ý tưởng đơn giản nhưng đầy tham vọng: “Với tất cả dữ liệu hiện có trên thế giới, rất ít trong số đó được chuyển đến tay những người ra quyết định”, Kirk McKeown, Đồng sáng lập kiêm Giám đốc điều hành của Carbon Arc, cho biết trong một cuộc phỏng vấn với VentureBeat được thực hiện tại một quán cà phê ở Thành phố New York vào tuần trước.
Carbon Arc đang giải quyết vấn đề đó bằng cách chuyển đổi các tập dữ liệu không có cấu trúc, bị cô lập thành các thông tin chi tiết sẵn sàng cho AI. Thông qua khuôn khổ ontology độc quyền của mình, nền tảng này chuẩn hóa dữ liệu riêng tư. Nó cung cấp dữ liệu theo yêu cầu—cung cấp một giải pháp thay thế cho các hợp đồng dữ liệu số lượng lớn thường khiến các doanh nghiệp phải trả tiền cho thông tin mà họ không sử dụng hết.
Giải phóng dữ liệu giao dịch, hành vi và tình cảm thực tế bị mắc kẹt
Mặc dù dữ liệu có ở khắp mọi nơi, phần lớn dữ liệu vẫn bị mắc kẹt trong bảng cân đối kế toán của công ty, các kho dữ liệu riêng lẻ và các hệ thống cũ.
Theo cách McKeown mô tả: “Dữ liệu cá nhân bị khóa trong mọi bảng cân đối kế toán trên thế giới. Nền kinh tế tạo ra lượng khí thải khổng lồ—dữ liệu biên lai, yêu cầu chăm sóc sức khỏe, yêu cầu thương mại, thẻ tín dụng—nhưng không chảy đến tay những người ra quyết định.”
Đồng thời, các doanh nghiệp do AI thúc đẩy đang phải đối mặt với tình trạng thu hẹp nguồn dữ liệu công khai có thể sử dụng. Với các mô hình ngôn ngữ lớn (LLM) đang nhanh chóng làm cạn kiệt các tập dữ liệu công khai, các doanh nghiệp phải tìm kiếm trí thông minh độc quyền, khác biệt để duy trì khả năng cạnh tranh.
McKeown cho biết: “Nhiều dữ liệu hơn có nghĩa là câu hỏi tốt hơn”. “Những công ty lớn sẽ cần ngày càng nhiều tài sản dữ liệu khác biệt khi họ tung ra thị trường”.
Giải pháp của Carbon Arc là xử lý dữ liệu như một tài sản tài chính, tạo ra một thị trường có cấu trúc cho dữ liệu theo cách mà cổ phiếu, trái phiếu và các sản phẩm phái sinh giao dịch ngày nay. Sự thay đổi này giới thiệu việc khám phá giá, khám phá nhu cầu và truy cập theo thời gian thực—mang lại tính thanh khoản cho nền kinh tế dữ liệu vốn không thanh khoản trong lịch sử.
McKeown nói thêm: “Thời đại thông minh không nên khác biệt so với các cuộc cách mạng trong quá khứ – mọi sự thay đổi lớn về công nghệ trong lịch sử đều đòi hỏi sự chuyển đổi trong nguồn nguyên liệu cơ bản để tạo ra năng lượng”.
Thị trường dữ liệu của Carbon Arc hoạt động như thế nào
Carbon Arc đã xây dựng một thị trường hai chiều, nơi chủ sở hữu dữ liệu đóng góp bộ dữ liệu của họ và doanh nghiệp trả tiền theo megabyte cho những thông tin chi tiết mà họ sử dụng.
- Mô hình định giá dựa trên mức tiêu thụ – Chuyển hoạt động mua dữ liệu từ chi phí CAPEX lớn sang các giao dịch nhỏ, trong đó mật độ và tốc độ tiêu thụ thúc đẩy giá trị.
- Truy cập theo API – Các công ty có thể tích hợp trí thông minh có cấu trúc trực tiếp vào quy trình phân tích, mô hình AI và công cụ doanh nghiệp.
- Lựa chọn dữ liệu chi tiết—Không giống như các nền tảng kết hợp KPI, Carbon Arc đảm bảo thông tin chi tiết thô, chưa qua lọc. McKeown nhấn mạnh , “Chúng tôi không kết hợp KPI vì chúng tôi không muốn đưa ra các quyết định chủ quan—những gì bạn chọn chính xác là những gì bạn nhận được.”
- Kiến trúc có khả năng mở rộng – Được thiết kế để truyền phát thông tin tình báo tần số cao trong các ngành như tài chính, bán lẻ, phát triển AI và truyền thông.
Mặc dù giá dựa trên mức tiêu thụ mang lại sự linh hoạt, nhưng cũng có thể khó quản lý. McKeown thừa nhận rằng “Giá dựa trên mức tiêu thụ là một giao dịch tuyệt vời, nhưng nó khiến mọi người sợ vì khó quản lý”. Để giải quyết vấn đề này, Carbon Arc đang giới thiệu một cấu trúc ví cho phép khách hàng kiểm soát tốt hơn chi tiêu của mình.
Đã cung cấp năng lượng cho các doanh nghiệp trên khắp các lĩnh vực
Nền tảng này hiện đang được sử dụng trong nhiều ngành công nghiệp:
- Các tổ chức tài chính và quỹ đầu cơ – Sử dụng thông tin thị trường theo thời gian thực cho các mô hình đầu tư.
- Các công ty AI và nhà phát triển LLM – Nâng cao đào tạo AI bằng các tập dữ liệu có cấu trúc, độc quyền.
- Thương hiệu bán lẻ và tiêu dùng – Theo dõi chi tiêu của người tiêu dùng, tối ưu hóa hoạt động kinh doanh và dự báo nhu cầu.
- Tổ chức truyền thông và chăm sóc sức khỏe – Cải thiện chuỗi cung ứng, sự tham gia của người tiêu dùng và hiệu quả hoạt động.
- Đội thể thao – Đội NHL Florida Panthers đã sử dụng thông tin chuyên sâu của Carbon Arc để phân tích sở thích của người hâm mộ, từ đó tạo ra các mối quan hệ đối tác giải trí mới.
Giao diện người dùng sạch sẽ và dễ điều hướng với bảng thông tin và biểu đồ tự động

Nền tảng của Carbon Arc được thiết kế để dễ sử dụng, với khả năng trực quan hóa dữ liệu tương tác, kết nối API và phát trực tuyến thông tin tình báo theo thời gian thực.
Các tính năng chính của giao diện:
- Bộ lọc có thể tùy chỉnh – Người dùng có thể phân đoạn dữ liệu theo danh mục, công ty, thương hiệu sản phẩm và số liệu chính.
- Bảng thông tin dữ liệu tương tác – Biểu đồ hiển thị thông tin chi tiết như lưu lượng truy cập trang web, chi tiêu tại POS và dữ liệu chuỗi cung ứng.
- Lập bản đồ mối quan hệ dựa trên biểu đồ – Người dùng có thể khám phá mối liên hệ giữa các thương hiệu, sản phẩm và đối thủ cạnh tranh.
- Tích hợp theo hướng API – Đảm bảo thông tin tình báo có cấu trúc chảy liền mạch vào các công cụ kinh doanh thông minh và mô hình AI.
Đối với các nhà bán lẻ, nền tảng này cung cấp thông tin so sánh theo thời gian thực về thị phần, xu hướng bán hàng và hành vi của người tiêu dùng giữa các đối thủ cạnh tranh như Lululemon, American Eagle và Abercrombie & Fitch.

Trong phân tích doanh nghiệp, người dùng có thể theo dõi xu hướng chi tiêu trên các nhà bán lẻ lớn như Walmart, Kroger và Target, cho phép xây dựng chiến lược định giá và tiếp thị dựa trên dữ liệu.
Điều này có ý nghĩa gì đối với các nhà phát triển và người ra quyết định về dữ liệu
Các nhà phát triển phần mềm và nhà khoa học dữ liệu thường phải đối mặt với những thách thức đáng kể khi xử lý dữ liệu phi cấu trúc. Carbon Arc đơn giản hóa quy trình này bằng cách tự động cấu trúc dữ liệu thô, cung cấp thông tin chi tiết theo thời gian thực thông qua API và loại bỏ nhu cầu xử lý trước mở rộng.
Thay vì cam kết ký hợp đồng dữ liệu số lượng lớn, doanh nghiệp chỉ cần sử dụng những thông tin chi tiết cần thiết, giúp giảm chi phí hoạt động và hạn chế ngân sách.
Những lợi ích chính bao gồm:
- Cải thiện khả năng truy cập dữ liệu – Các tập dữ liệu có giá trị cao sẽ khả dụng mà không cần trích xuất phức tạp hoặc xử lý thủ công.
- Mô hình định giá linh hoạt – Các tổ chức có thể thanh toán dựa trên mức tiêu thụ dữ liệu thực tế, tối ưu hóa chi phí.
- Tích hợp theo hướng API – Thông tin chi tiết về dữ liệu có thể được tích hợp trực tiếp vào các công cụ phân tích, bảng thông tin và quy trình ra quyết định hiện có.
- Bộ dữ liệu lịch sử và liên tục được cập nhật – Các công ty có được thông tin chi tiết mới nhất mà không cần dựa vào đường ống dữ liệu phân mảnh, chậm chạp.
McKeown giải thích rằng: “Dự đoán của AI sẽ ngày càng tốt hơn theo thời gian, nhưng chúng luôn cần dữ liệu lịch sử làm nền tảng”, đồng thời nêu rõ Carbon Arc có dữ liệu từ nhiều thế kỷ trước nhưng vẫn liên tục bổ sung các bản cập nhật mới hàng tuần hoặc hàng ngày, tùy thuộc vào phân khúc cụ thể.
Ngoài ra, công ty còn đảm bảo dữ liệu được sao lưu ở nhiều vị trí.
“Chúng tôi phát cuồng vì sự dư thừa,” McKeown nói với tôi. “Tôi không bao giờ muốn bị một nhà cung cấp dữ liệu duy nhất lợi dụng—chúng tôi có nhiều nguồn để bảo vệ chống lại việc tăng giá hoặc gián đoạn nguồn cung.”
Biến dữ liệu từ sản phẩm nghiên cứu thành tài sản có thể giao dịch
McKeown coi nền tảng của Carbon Arc là một phần của sự thay đổi lớn hơn về cách dữ liệu được định giá và trao đổi.
“Chúng tôi đang xây dựng một thị trường dữ liệu theo cách mà cổ phiếu, trái phiếu và các sản phẩm phái sinh giao dịch hiện nay—đưa chức năng phát hiện giá và phát hiện nhu cầu vào một sàn giao dịch có cấu trúc.”
Sự thay đổi cơ bản trong kinh tế dữ liệu này có thể định hình lại AI, tài chính và trí tuệ kinh doanh, giúp thông tin chi tiết theo thời gian thực dễ tiếp cận hơn và tiết kiệm chi phí hơn.
Với 55 triệu đô la tài trợ, Carbon Arc đang ở vị thế tốt để định nghĩa lại cách các doanh nghiệp tiếp cận, giao dịch và tích hợp thông tin tình báo. Bằng cách biến dữ liệu thành một tài sản lưu động, có thể giao dịch, công ty đang giải quyết một trong những thách thức lớn nhất trong AI và ra quyết định kinh doanh hiện nay—đảm bảo rằng dữ liệu không còn bị khóa mà chủ động thúc đẩy hiểu biết sâu sắc và đổi mới.