Cách xây dựng kiến trúc dữ liệu để thúc đẩy sự đổi mới

Trong vài năm qua, các tổ chức đã phải nhanh chóng triển khai các công nghệ dữ liệu mới cùng với cơ sở hạ tầng kế thừa để thúc đẩy các đổi mới theo định hướng thị trường, chẳng hạn như ưu đãi được cá nhân hóa, cảnh báo thời gian thực và bảo trì dự đoán.

Tuy nhiên, những bổ sung kỹ thuật này — từ hồ dữ liệu đến nền tảng phân tích khách hàng đến xử lý luồng — đã làm tăng độ phức tạp của kiến trúc dữ liệu lên rất nhiều, thường cản trở đáng kể khả năng liên tục của tổ chức trong việc cung cấp các khả năng mới, duy trì cơ sở hạ tầng hiện có và đảm bảo tính toàn vẹn của trí tuệ nhân tạo ( Mô hình AI).

Động lực thị trường hiện tại không cho phép sự chậm lại như vậy. Các nhà lãnh đạo như Amazon và Google đã và đang tận dụng những đổi mới công nghệ trong AI để cải tiến các mô hình kinh doanh truyền thống, đòi hỏi những người đi sau phải hình dung lại các khía cạnh của doanh nghiệp riêng của họ để theo kịp. Các nhà cung cấp dịch vụ đám mây đã tung ra các dịch vụ tiên tiến, chẳng hạn như nền tảng dữ liệu không máy chủ có thể được triển khai ngay lập tức, cho phép người dùng tận hưởng thời gian tiếp thị nhanh hơn và nhanh nhẹn hơn. Người dùng Analytics đang yêu cầu các công cụ liền mạch hơn, chẳng hạn như nền tảng triển khai mô hình tự động, để họ có thể sử dụng các mô hình mới nhanh chóng hơn. Nhiều tổ chức đã áp dụng giao diện lập trình ứng dụng (API) để hiển thị dữ liệu từ các hệ thống khác nhau vào hồ dữ liệu của chúng và nhanh chóng tích hợp thông tin chi tiết trực tiếp vào các ứng dụng front-end. Giờ đây, khi các công ty điều hướng cuộc khủng hoảng nhân đạo chưa từng có do đại dịch COVID-19 gây ra và chuẩn bị cho điều bình thường tiếp theo , nhu cầu về sự linh hoạt và tốc độ chỉ càng tăng lên.

Đối với các công ty để xây dựng lợi thế cạnh tranh — hoặc thậm chí để duy trì tính ngang bằng, họ sẽ cần một cách tiếp cận mới để xác định, triển khai và tích hợp các ngăn xếp dữ liệu của họ, tận dụng cả đám mây (ngoài cơ sở hạ tầng như một dịch vụ) và các khái niệm và thành phần mới.

Sáu lần thay đổi để tạo ra một kiến trúc dữ liệu thay đổi trò chơi

Chúng tôi đã quan sát thấy sáu thay đổi cơ bản mà các công ty đang thực hiện đối với bản thiết kế kiến trúc dữ liệu của họ để cho phép cung cấp nhanh hơn các khả năng mới và đơn giản hóa đáng kể các phương pháp tiếp cận kiến trúc hiện có (triển lãm). Chúng liên quan đến gần như tất cả các hoạt động dữ liệu, bao gồm cả thu thập, xử lý, lưu trữ, phân tích và hiển thị. Mặc dù các tổ chức có thể thực hiện một số thay đổi trong khi vẫn giữ nguyên ngăn xếp công nghệ cốt lõi của họ, nhưng nhiều tổ chức yêu cầu phải tái cấu trúc cẩn thận cơ sở hạ tầng và nền tảng dữ liệu hiện có, bao gồm cả công nghệ cũ và công nghệ mới hơn đã được củng cố trước đó.

Những nỗ lực như vậy không phải là không đáng kể. Các khoản đầu tư thường có thể dao động từ hàng chục triệu đô la để xây dựng khả năng cho các trường hợp sử dụng cơ bản, chẳng hạn như báo cáo tự động, đến hàng trăm triệu đô la để đưa vào các thành phần kiến trúc cho các khả năng tiên tiến, chẳng hạn như các dịch vụ thời gian thực trong để cạnh tranh với những người phá vỡ sáng tạo nhất. Do đó, điều quan trọng đối với các tổ chức là phải có một kế hoạch chiến lược rõ ràng và các nhà lãnh đạo dữ liệu và công nghệ sẽ cần phải đưa ra những lựa chọn táo bạo để ưu tiên những thay đổi sẽ ảnh hưởng trực tiếp nhất đến các mục tiêu kinh doanh và đầu tư vào mức độ tinh vi của kiến trúc. Kết quả là, các bản thiết kế kiến trúc dữ liệu thường trông rất khác nhau giữa các công ty.

Khi thực hiện đúng, lợi tức đầu tư có thể rất đáng kể (hơn 500 triệu đô la hàng năm trong trường hợp một ngân hàng Hoa Kỳ và tăng trưởng tỷ suất lợi nhuận từ 12 đến 15 phần trăm trong trường hợp một công ty dầu khí). Chúng tôi nhận thấy những loại lợi ích này có thể đến từ bất kỳ lĩnh vực nào: tiết kiệm chi phí CNTT, cải thiện năng suất, giảm rủi ro về quy định và hoạt động cũng như cung cấp các khả năng, dịch vụ hoàn toàn mới và thậm chí toàn bộ hoạt động kinh doanh.

Vì vậy, những thay đổi chính nào mà các tổ chức cần phải xem xét?

Phổ biến

TẠI SAO DOANH NGHIỆP CẦN TƯ VẤN TRƯỚC KHI THỰC HIỆN CHUYỂN ĐỔI SỐ

09/06/2023

Quản trị dữ liệu trong xu thế Chuyển đổi số

24/03/2023

Vai trò của quản trị thay đổi trong chuyển đổi số

23/03/2023

fanpage

Youtube

1. Từ nền tảng dữ liệu tại chỗ sang nền tảng dữ liệu dựa trên đám mây

Đám mây có lẽ là động lực đột phá nhất của cách tiếp cận kiến trúc dữ liệu hoàn toàn mới, vì nó cung cấp cho các công ty một cách để mở rộng quy mô nhanh chóng các công cụ và khả năng AI để có lợi thế cạnh tranh. Các nhà cung cấp đám mây toàn cầu lớn như Amazon (với Amazon Web Services), Google (với Google Cloud Platform) và Microsoft (với Microsoft Azure) đã cách mạng hóa cách các tổ chức thuộc mọi quy mô tạo nguồn, triển khai và chạy cơ sở hạ tầng dữ liệu, nền tảng và ứng dụng ở quy mô lớn.

Ví dụ: một công ty dịch vụ tiện ích đã kết hợp nền tảng dữ liệu dựa trên đám mây với công nghệ vùng chứa, chứa các dịch vụ vi mô như tìm kiếm dữ liệu thanh toán hoặc thêm các thuộc tính mới vào tài khoản, để mô-đun hóa các khả năng của ứng dụng. Điều này cho phép công ty triển khai các khả năng tự phục vụ mới cho khoảng 100.000 khách hàng doanh nghiệp trong vài ngày chứ không phải vài tháng, cung cấp một lượng lớn dữ liệu giao dịch và hàng tồn kho theo thời gian thực cho người dùng cuối để phân tích và giảm chi phí bằng cách “lưu vào bộ đệm” các giao dịch trên đám mây chứ không phải trên các hệ thống kế thừa tại chỗ đắt tiền hơn.

Kích hoạt các khái niệm và thành phần

Nền tảng dữ liệu không máy chủ, chẳng hạn như Amazon S3 và Google BigQuery, cho phép các tổ chức xây dựng và vận hành các ứng dụng tập trung vào dữ liệu với quy mô vô hạn mà không gặp rắc rối trong việc cài đặt và định cấu hình các giải pháp hoặc quản lý khối lượng công việc. Những dịch vụ như vậy có thể làm giảm yêu cầu chuyên môn, tốc độ triển khai từ vài tuần xuống còn ít nhất là vài phút và hầu như không yêu cầu chi phí vận hành.
Các giải pháp dữ liệu được chứa trong vùng sử dụng Kubernetes (có sẵn thông qua các nhà cung cấp đám mây cũng như mã nguồn mở và có thể được tích hợp và triển khai nhanh chóng) cho phép các công ty phân tách và tự động triển khai các hệ thống lưu trữ dữ liệu và sức mạnh máy tính bổ sung. Khả năng này đặc biệt có giá trị trong việc đảm bảo rằng các nền tảng dữ liệu có thiết lập phức tạp hơn, chẳng hạn như những nền tảng cần thiết để lưu giữ dữ liệu từ phiên ứng dụng này sang phiên ứng dụng khác và những nền tảng có yêu cầu sao lưu và phục hồi phức tạp, có thể mở rộng để đáp ứng nhu cầu.

2. Từ xử lý dữ liệu hàng loạt đến thời gian thực

Chi phí cho khả năng truyền phát và nhắn tin dữ liệu theo thời gian thực đã giảm đáng kể, mở đường cho việc sử dụng phổ biến. Những công nghệ này cho phép một loạt các ứng dụng kinh doanh mới: ví dụ, các công ty vận tải có thể thông báo cho khách hàng khi taxi của họ tiếp cận với các dự đoán đến chính xác đến từng giây; các công ty bảo hiểm có thể phân tích dữ liệu hành vi theo thời gian thực từ các thiết bị thông minh để cá nhân hóa tỷ lệ; và các nhà sản xuất có thể dự đoán các vấn đề về cơ sở hạ tầng dựa trên dữ liệu cảm biến thời gian thực.

Các chức năng phát trực tuyến theo thời gian thực, chẳng hạn như cơ chế đăng ký, cho phép người tiêu dùng dữ liệu, bao gồm cả các trung tâm dữ liệu và nhân viên dựa trên dữ liệu, đăng ký “chủ đề” để họ có thể nhận được nguồn cấp dữ liệu liên tục về các giao dịch mà họ cần. Một hồ dữ liệu chung thường đóng vai trò là “bộ não” cho các dịch vụ như vậy, giữ lại tất cả các giao dịch chi tiết.

Bỏ qua các khái niệm và thành phần

Các nền tảng nhắn tin như Apache Kafka cung cấp các dịch vụ đăng ký / xuất bản hoàn toàn có thể mở rộng, bền và chịu được lỗi, có thể xử lý và lưu trữ hàng triệu tin nhắn mỗi giây để sử dụng ngay lập tức hoặc sau đó. Điều này cho phép hỗ trợ các trường hợp sử dụng thời gian thực, bỏ qua các giải pháp dựa trên lô hiện có và dấu chân (và cơ sở chi phí) nhẹ hơn nhiều so với hàng đợi nhắn tin doanh nghiệp truyền thống.
Các giải pháp phân tích và xử lý luồng như Apache Kafka Streaming, Apache Flume, Apache Storm và Apache Spark Streaming cho phép phân tích trực tiếp các thư trong thời gian thực. Phân tích này có thể dựa trên quy tắc hoặc liên quan đến phân tích nâng cao để trích xuất các sự kiện hoặc tín hiệu từ dữ liệu. Thông thường, phân tích tích hợp dữ liệu lịch sử để so sánh các mẫu, điều này đặc biệt quan trọng trong các công cụ khuyến nghị và dự đoán.
Các nền tảng cảnh báo như Graphite hoặc Splunk có thể kích hoạt các hành động kinh doanh cho người dùng, chẳng hạn như thông báo cho đại diện bán hàng nếu họ không đạt mục tiêu doanh số hàng ngày hoặc tích hợp các hành động này vào các quy trình hiện có có thể chạy trong kế hoạch nguồn lực doanh nghiệp (ERP) hoặc mối quan hệ với khách hàng hệ thống quản lý (CRM).

3. Từ các giải pháp thương mại được tích hợp trước đến các nền tảng mô-đun, tốt nhất

Để mở rộng quy mô ứng dụng, các công ty thường cần phải vượt ra ngoài ranh giới của hệ sinh thái dữ liệu kế thừa từ các nhà cung cấp giải pháp lớn. Nhiều người hiện đang hướng tới một kiến trúc dữ liệu mô-đun cao sử dụng các thành phần mã nguồn mở tốt nhất và thường xuyên, có thể được thay thế bằng các công nghệ mới nếu cần mà không ảnh hưởng đến các phần khác của kiến trúc dữ liệu.

Công ty dịch vụ tiện ích được đề cập trước đó đang chuyển đổi sang cách tiếp cận này để nhanh chóng cung cấp các dịch vụ kỹ thuật số mới, nhiều dữ liệu cho hàng triệu khách hàng và kết nối các ứng dụng dựa trên đám mây trên quy mô lớn. Ví dụ: nó cung cấp các quan điểm chính xác hàng ngày về mức tiêu thụ năng lượng của khách hàng và thông tin chi tiết về phân tích thời gian thực so sánh mức tiêu thụ cá nhân với các nhóm ngang hàng. Công ty thiết lập một lớp dữ liệu độc lập bao gồm cả cơ sở dữ liệu thương mại và các thành phần nguồn mở. Dữ liệu được đồng bộ hóa với các hệ thống back-end thông qua bus dịch vụ doanh nghiệp độc quyền và các dịch vụ vi mô được lưu trữ trong các thùng chứa chạy logic nghiệp vụ trên dữ liệu.

Kích hoạt các khái niệm và thành phần

Đường ống dữ liệu và các giao diện dựa trên API giúp đơn giản hóa việc tích hợp giữa các công cụ và nền tảng khác nhau bằng cách bảo vệ các nhóm dữ liệu khỏi sự phức tạp của các lớp khác nhau, tăng tốc thời gian đưa ra thị trường và giảm nguy cơ gây ra các vấn đề mới trong các ứng dụng hiện có. Các giao diện này cũng cho phép thay thế các thành phần riêng lẻ dễ dàng hơn khi các yêu cầu thay đổi.
Các bàn làm việc phân tích như Amazon Sagemaker và Kubeflow đơn giản hóa việc xây dựng các giải pháp end-to-end trong một kiến trúc mô-đun cao. Những công cụ như vậy có thể kết nối với nhiều loại cơ sở dữ liệu và dịch vụ cơ bản và cho phép thiết kế theo mô-đun cao.

4. Truy cập từ điểm đến điểm đến dữ liệu tách rời

Việc hiển thị dữ liệu qua API có thể đảm bảo rằng quyền truy cập trực tiếp để xem và sửa đổi dữ liệu bị hạn chế và an toàn, đồng thời cung cấp quyền truy cập cập nhật, nhanh hơn vào các tập dữ liệu chung. Điều này cho phép dễ dàng sử dụng lại dữ liệu giữa các nhóm, tăng tốc truy cập và cho phép cộng tác liền mạch giữa các nhóm phân tích để các trường hợp sử dụng AI có thể được phát triển hiệu quả hơn.

Ví dụ: một công ty dược phẩm đang thiết lập “thị trường dữ liệu” nội bộ cho tất cả nhân viên thông qua API để đơn giản hóa và chuẩn hóa quyền truy cập vào các tài sản dữ liệu cốt lõi thay vì dựa vào các giao diện độc quyền. Công ty đang dần dần — hơn 18 tháng — chuyển các nguồn cấp dữ liệu hiện có có giá trị nhất sang cấu trúc dựa trên API và triển khai nền tảng quản lý API để hiển thị các API cho người dùng.

Kích hoạt các khái niệm và thành phần

Nền tảng quản lý API (thường được gọi là cổng API) là cần thiết để tạo và xuất bản các API tập trung vào dữ liệu, triển khai các chính sách sử dụng, kiểm soát quyền truy cập cũng như đo lường việc sử dụng và hiệu suất. Nền tảng này cũng cho phép các nhà phát triển và người dùng tìm kiếm các giao diện dữ liệu hiện có và sử dụng lại chúng thay vì xây dựng các giao diện mới. Cổng API thường được nhúng như một vùng riêng biệt trong trung tâm dữ liệu nhưng cũng có thể được phát triển như một khả năng độc lập bên ngoài trung tâm.
Thường cần phải có một nền tảng dữ liệu để “đệm” cho các giao dịch bên ngoài các hệ thống cốt lõi . Các bộ đệm như vậy có thể được cung cấp bởi các nền tảng dữ liệu trung tâm như hồ dữ liệu hoặc trong lưới dữ liệu phân tán, là một hệ sinh thái bao gồm các nền tảng phù hợp nhất (bao gồm hồ dữ liệu, kho dữ liệu, v.v.) được tạo cho dữ liệu dự kiến của từng miền doanh nghiệp sử dụng và khối lượng công việc. Ví dụ: một ngân hàng đã xây dựng cơ sở dữ liệu dạng cột để cung cấp thông tin khách hàng, chẳng hạn như các giao dịch tài chính gần đây nhất của họ, trực tiếp đến các ứng dụng ngân hàng trực tuyến và di động, đồng thời giảm khối lượng công việc tốn kém trên máy tính lớn của nó.

5. Từ kho doanh nghiệp đến kiến trúc dựa trên miền

Nhiều nhà lãnh đạo kiến trúc dữ liệu đã xoay trục từ hồ dữ liệu doanh nghiệp trung tâm sang các thiết kế “hướng theo miền” có thể được tùy chỉnh và “phù hợp với mục đích” để cải thiện thời gian tiếp thị các sản phẩm và dịch vụ dữ liệu mới. Với cách tiếp cận này, mặc dù các tập dữ liệu vẫn có thể nằm trên cùng một nền tảng vật lý, nhưng “chủ sở hữu sản phẩm” trong từng lĩnh vực kinh doanh (ví dụ: tiếp thị, bán hàng, sản xuất, v.v.) có nhiệm vụ tổ chức các tập dữ liệu của họ trong một cả cho người dùng trong miền của họ và cho người tiêu dùng dữ liệu hạ nguồn trong các miền kinh doanh khác. Cách tiếp cận này đòi hỏi sự cân bằng cẩn thận để tránh trở nên phân mảnh và kém hiệu quả, nhưng đổi lại nó có thể giảm thời gian đầu tư vào việc xây dựng các mô hình dữ liệu mới, thường từ vài tháng xuống chỉ vài ngày,

Một nhà cung cấp viễn thông châu Âu đã sử dụng kiến trúc dựa trên miền phân tán để nhân viên bán hàng và vận hành có thể hiển thị dữ liệu khách hàng, đơn đặt hàng và thanh toán cho các nhà khoa học dữ liệu để sử dụng trong các mô hình AI hoặc trực tiếp cho khách hàng thông qua các kênh kỹ thuật số. Thay vì xây dựng một nền tảng dữ liệu trung tâm, tổ chức đã triển khai các nền tảng hợp lý được quản lý bởi các chủ sở hữu sản phẩm trong nhóm hoạt động và bán hàng của công ty. Chủ sở hữu sản phẩm được khuyến khích thúc đẩy việc sử dụng dữ liệu để phân tích và đang sử dụng các kênh kỹ thuật số cũng như diễn đàn và hackathons để thúc đẩy việc áp dụng.

Kích hoạt các khái niệm và thành phần

Cơ sở hạ tầng dữ liệu như một nền tảng cung cấp các công cụ và khả năng chung để lưu trữ và quản lý nhằm tăng tốc độ triển khai và loại bỏ gánh nặng xây dựng nền tảng tài sản-dữ liệu của riêng họ.
Các kỹ thuật ảo hóa dữ liệu , vốn bắt đầu trong các lĩnh vực thích hợp như dữ liệu khách hàng, hiện đang được sử dụng trong các doanh nghiệp để tổ chức truy cập và tích hợp các tài sản dữ liệu phân tán.
Các công cụ lập danh mục dữ liệu cung cấp cho doanh nghiệp tìm kiếm và thăm dò dữ liệu mà không yêu cầu quyền truy cập hoặc chuẩn bị đầy đủ. Danh mục cũng thường cung cấp các định nghĩa siêu dữ liệu và giao diện end-to-end để đơn giản hóa quyền truy cập vào nội dung dữ liệu.

6. Từ các mô hình dữ liệu cứng nhắc sang các lược đồ dữ liệu linh hoạt, có thể mở rộng

Các mô hình dữ liệu được xác định trước từ các nhà cung cấp phần mềm và các mô hình dữ liệu độc quyền phục vụ nhu cầu kinh doanh cụ thể thường được xây dựng trong các lược đồ chuẩn hóa cao với các bảng cơ sở dữ liệu cứng nhắc và các phần tử dữ liệu để giảm thiểu dư thừa. Mặc dù cách tiếp cận này vẫn là tiêu chuẩn cho các trường hợp sử dụng tập trung vào quy định và báo cáo, nhưng nó cũng yêu cầu các tổ chức phải trải qua các chu kỳ phát triển dài và có kiến thức hệ thống vững chắc khi họ muốn kết hợp các phần tử dữ liệu hoặc nguồn dữ liệu mới, vì bất kỳ thay đổi nào cũng có thể ảnh hưởng đến tính toàn vẹn của dữ liệu.

Để có được tính linh hoạt cao hơn và lợi thế cạnh tranh mạnh mẽ khi khám phá dữ liệu hoặc hỗ trợ phân tích nâng cao, các công ty đang phát triển sang phương pháp tiếp cận “ánh sáng giản đồ”, sử dụng các mô hình dữ liệu không chuẩn hóa, có ít bảng vật lý hơn, để tổ chức dữ liệu cho hiệu suất tối đa. Cách tiếp cận này mang lại nhiều lợi ích: khám phá dữ liệu nhanh, linh hoạt hơn trong việc lưu trữ dữ liệu có cấu trúc và phi cấu trúc, đồng thời giảm độ phức tạp, vì các nhà lãnh đạo dữ liệu không còn cần phải giới thiệu các lớp trừu tượng bổ sung, chẳng hạn như nhiều “liên kết” giữa các bảng được chuẩn hóa cao, để truy vấn dữ liệu quan hệ.

Kích hoạt các khái niệm và thành phần

Các kỹ thuật Data vault 2.0 , chẳng hạn như mô hình điểm dữ liệu, có thể đảm bảo rằng các mô hình dữ liệu có thể mở rộng được để các phần tử dữ liệu có thể được thêm vào hoặc xóa bỏ trong tương lai với sự gián đoạn hạn chế.
Cơ sở dữ liệu đồ thị , một loại cơ sở dữ liệu NoSQL, đã được chú ý trong những năm gần đây. Cơ sở dữ liệu NoSQL nói chung là lý tưởng cho các ứng dụng kỹ thuật số yêu cầu khả năng mở rộng lớn và khả năng thời gian thực, và cho các lớp dữ liệu phục vụ các ứng dụng AI, nhờ khả năng khai thác dữ liệu phi cấu trúc. Đặc biệt, cơ sở dữ liệu đồ thị cung cấp khả năng mô hình hóa các mối quan hệ bên trong dữ liệu một cách mạnh mẽ và linh hoạt, và nhiều công ty đang xây dựng kho dữ liệu tổng thể bằng cách sử dụng cơ sở dữ liệu đồ thị để phù hợp với các mô hình thông tin đang thay đổi.
Các dịch vụ công nghệ như Azure Synapse Analytics cho phép truy vấn dữ liệu dựa trên tệp tương tự như cơ sở dữ liệu quan hệ bằng cách áp dụng động cấu trúc bảng vào tệp. Điều này cung cấp cho người dùng sự linh hoạt để tiếp tục sử dụng các giao diện phổ biến như SQL trong khi truy cập dữ liệu được lưu trữ trong tệp.
Việc sử dụng JavaScript Object Notation (JSON) để lưu trữ thông tin cho phép các tổ chức thay đổi cấu trúc cơ sở dữ liệu mà không cần phải thay đổi mô hình thông tin kinh doanh.

Làm thế nào để bắt đầu?

Công nghệ dữ liệu đang phát triển nhanh chóng, khiến các nỗ lực truyền thống xác định và xây dựng hướng tới các trạng thái kiến trúc mục tiêu kéo dài từ 3 đến 5 năm cả rủi ro và không hiệu quả. Các nhà lãnh đạo về dữ liệu và công nghệ sẽ được phục vụ tốt nhất bằng các thực tiễn thiết lập cho phép họ nhanh chóng đánh giá và triển khai các công nghệ mới để họ có thể nhanh chóng thích ứng. Bốn thực hành là rất quan trọng ở đây:

Áp dụng tư duy thử nghiệm và học hỏi vào việc xây dựng kiến trúc và thử nghiệm với các thành phần và khái niệm khác nhau. Các thực hành nhanh như vậy đã được áp dụng trong phát triển ứng dụng trong một thời gian khá dài và gần đây đã chuyển sang không gian dữ liệu. Ví dụ: thay vì tham gia vào các cuộc thảo luận kéo dài về các thiết kế, sản phẩm và nhà cung cấp tối ưu để xác định lựa chọn “hoàn hảo”, sau đó là phê duyệt ngân sách kéo dài, các nhà lãnh đạo có thể bắt đầu với ngân sách nhỏ hơn và tạo ra các sản phẩm khả thi tối thiểu hoặc xâu chuỗi nguồn mở hiện có lại với nhau các công cụ để tạo ra một sản phẩm tạm thời, đưa chúng vào sản xuất (sử dụng đám mây để tăng tốc) để chúng có thể chứng minh giá trị của mình trước khi mở rộng và phát triển hơn nữa.
Thiết lập “bộ lạc” dữ liệu, nơi các nhóm quản lý dữ liệu, kỹ sư dữ liệu và người lập mô hình dữ liệu cùng làm việc với trách nhiệm giải trình đầu cuối để xây dựng kiến trúc dữ liệu. Các bộ lạc này cũng làm việc để đưa ra các quy trình tiêu chuẩn, dữ liệu có thể lặp lại và các quy trình kỹ thuật tính năng để hỗ trợ phát triển các tập dữ liệu được quản lý cao sẵn sàng cho việc lập mô hình. Các thực hành dữ liệu nhanh này có thể giúp đẩy nhanh thời gian đưa ra thị trường các dịch vụ dữ liệu mới.
Đầu tư vào DataOps (DevOps nâng cao cho dữ liệu), có thể giúp đẩy nhanh quá trình thiết kế, phát triển và triển khai các thành phần mới vào kiến trúc dữ liệu để các nhóm có thể nhanh chóng triển khai và thường xuyên cập nhật các giải pháp dựa trên phản hồi.
Tạo văn hóa dữ liệu nơi nhân viên mong muốn sử dụng và áp dụng các dịch vụ dữ liệu mới trong vai trò của họ. Một công cụ thiết yếu để đạt được điều này là đảm bảo rằng chiến lược dữ liệu gắn liền với các mục tiêu kinh doanh và được phản ánh trong các thông điệp của C-suite tới tổ chức, điều này có thể giúp củng cố tầm quan trọng của công việc này đối với các nhóm kinh doanh.

Khi dữ liệu, phân tích và AI được nhúng nhiều hơn vào các hoạt động hàng ngày của hầu hết các tổ chức, rõ ràng là cần phải có một cách tiếp cận hoàn toàn khác đối với kiến trúc dữ liệu để tạo và phát triển doanh nghiệp tập trung vào dữ liệu. Những nhà lãnh đạo dữ liệu và công nghệ áp dụng cách tiếp cận mới này sẽ định vị tốt hơn cho công ty của họ để trở nên nhanh nhẹn, kiên cường và cạnh tranh cho bất cứ điều gì ở phía trước.

Reference:

Antonio Castro, Jorge Machado, Matthias Roggendorf và Henning Soller (June 3, 2020), How to build a data architecture to drive innovation—today and tomorrow, from https://www.mckinsey.com/business-functions/mckinsey-digital/our-insights/how-to-build-a-data-architecture-to-drive-innovation-today-and-tomorrow

Sáu lần thay đổi để tạo ra một kiến ​​trúc dữ liệu thay đổi trò chơi

TẠI SAO DOANH NGHIỆP CẦN TƯ VẤN TRƯỚC KHI THỰC HIỆN CHUYỂN ĐỔI SỐ

Quản trị dữ liệu trong xu thế Chuyển đổi số

Vai trò của quản trị thay đổi trong chuyển đổi số

fanpage

Youtube

1. Từ nền tảng dữ liệu tại chỗ sang nền tảng dữ liệu dựa trên đám mây

2. Từ xử lý dữ liệu hàng loạt đến thời gian thực

3. Từ các giải pháp thương mại được tích hợp trước đến các nền tảng mô-đun, tốt nhất

4. Truy cập từ điểm đến điểm đến dữ liệu tách rời

5. Từ kho doanh nghiệp đến kiến ​​trúc dựa trên miền

6. Từ các mô hình dữ liệu cứng nhắc sang các lược đồ dữ liệu linh hoạt, có thể mở rộng

Làm thế nào để bắt đầu?

Related Posts

Sáu lần thay đổi để tạo ra một kiến trúc dữ liệu thay đổi trò chơi

5. Từ kho doanh nghiệp đến kiến trúc dựa trên miền