Xử lý phân tích trực tuyến, hoặc OLAP, là một công nghệ xử lý dữ liệu hiệu quả, do đó, dựa trên các mảng lớn của tất cả các loại dữ liệu, thông tin cuối cùng được hiển thị. Đây là một sản phẩm mạnh mẽ giúp truy cập, truy xuất và xem thông tin trên PC, phân tích nó từ các quan điểm khác nhau.
OLAP là một công cụ cung cấp vị trí chiến lược để lập kế hoạch dài hạn và xem xét thông tin cơ bản của dữ liệu vận hành cho viễn cảnh 5, 10 năm trở lên. Dữ liệu được lưu trữ trong cơ sở dữ liệu với thứ nguyên, là thuộc tính của chúng. Người dùng có thể xem cùng một tập dữ liệu với các thuộc tính khác nhau, tùy thuộc vào mục đích phân tích.
Lịch sử OLAP
OLAP không phải là một khái niệm mới và đã được sử dụng trong nhiều thập kỷ. Trên thực tế, nguồn gốc của công nghệ đã được bắt nguồn từ năm 1962. Nhưng thuật ngữ này chỉ được đặt ra vào năm 1993 bởi tác giả cơ sở dữ liệu Ted Coddom, người cũng đặt ra 12 quy tắc cho sản phẩm. Như trong nhiều ứng dụng khác, khái niệm này đã trải qua nhiều giai đoạn tiến hóa.
Lịch sử của công nghệ OLAP bắt đầu từ năm 1970, khi tài nguyên thông tin Express và máy chủ Olap đầu tiên được phát hành. Chúng được Oracle mua lại vào năm 1995 và sau đó trở thành cơ sở của quá trình xử lý phân tích trực tuyến về cơ chế tính toán đa chiều mà thương hiệu máy tính nổi tiếng cung cấp trong cơ sở dữ liệu của nó. Năm 1992, một sản phẩm xử lý phân tích trực tuyến nổi tiếng khác là Essbase được phát hành bởi Arbor Software (được Oracle mua lại vào năm 2007).

Năm 1998, Microsoft phát hành máy chủ xử lý dữ liệu phân tích trực tuyến, Dịch vụ phân tích MS. Điều này góp phần vào sự phổ biến của công nghệ và thúc đẩy sự phát triển của các sản phẩm khác. Ngày nay, có một số nhà cung cấp nổi tiếng thế giới cung cấp các ứng dụng Olap, bao gồm IBM, SAS, SAP, Essbase, Microsoft, Oracle, IcCube.
Xử lý phân tích trực tuyến
OLAP là một công cụ cho phép bạn đưa ra quyết định về các sự kiện theo kế hoạch. Tính toán Olap không điển hình có thể phức tạp hơn so với việc chỉ tổng hợp dữ liệu. Truy vấn phân tích mỗi phút (AQM) được sử dụng làm tài liệu tham khảo tiêu chuẩn để so sánh hiệu suất của các công cụ khác nhau. Các hệ thống này sẽ ẩn người dùng càng nhiều càng tốt khỏi cú pháp của các truy vấn phức tạp và cung cấp thời gian phản hồi nhất quán cho mọi người (bất kể chúng phức tạp đến mức nào).
Các tính năng chính sau đây của OLAP tồn tại:
- Biểu diễn dữ liệu đa chiều.
- Hỗ trợ tính toán phức tạp.
- Trí thông minh tạm thời.
Trình bày đa chiều cung cấp cơ sở cho xử lý phân tích thông qua truy cập linh hoạt vào dữ liệu của công ty. Nó cho phép người dùng phân tích dữ liệu theo bất kỳ chiều nào và ở bất kỳ mức độ tổng hợp nào.
Hỗ trợ cho tính toán phức tạp là nền tảng của phần mềm OLAP.
Trí thông minh tạm thời được sử dụng để đánh giá hiệu quả của bất kỳ ứng dụng phân tích nào trong một khoảng thời gian cụ thể. Chẳng hạn, tháng này so với tháng trước, tháng này so với cùng tháng năm ngoái.
Cấu trúc dữ liệu đa chiều
Một trong những đặc điểm chính của xử lý phân tích trực tuyến là cấu trúc dữ liệu đa chiều. Một khối lập phương có thể có một số kích thước. Nhờ mô hình này, toàn bộ quá trình phân tích thông minh OLAP rất đơn giản đối với các nhà quản lý và giám đốc điều hành, vì các đối tượng được thể hiện trong các ô là các đối tượng kinh doanh trong thế giới thực. Ngoài ra, mô hình dữ liệu này cho phép người dùng xử lý không chỉ các mảng có cấu trúc, mà cả các cấu trúc không cấu trúc và bán cấu trúc.Tất cả điều này làm cho chúng đặc biệt phổ biến để phân tích dữ liệu và các ứng dụng BI.

Các tính năng chính của Hệ thống OLAP:
- Sử dụng phương pháp phân tích dữ liệu đa chiều.
- Cung cấp hỗ trợ cơ sở dữ liệu nâng cao.
- Tạo giao diện người dùng cuối dễ sử dụng.
- Hỗ trợ kiến trúc máy khách / máy chủ.
Một trong những thành phần chính của khái niệm OLAP là máy chủ phía máy khách. Ngoài việc tổng hợp và xử lý dữ liệu từ cơ sở dữ liệu quan hệ, nó còn cung cấp các tham số tính toán và ghi nâng cao, các chức năng bổ sung, khả năng truy vấn nâng cao cơ bản và các chức năng khác.
Tùy thuộc vào ứng dụng mẫu do người dùng chọn, có sẵn nhiều mô hình dữ liệu và công cụ khác nhau, bao gồm cảnh báo theo thời gian thực, chức năng áp dụng các kịch bản giả định, tối ưu hóa và báo cáo OLAP phức tạp.
Hình khối
Khái niệm này dựa trên một hình khối. Vị trí của dữ liệu trong đó cho thấy cách OLAP tuân thủ nguyên tắc phân tích đa biến, do đó cấu trúc dữ liệu được tạo để phân tích nhanh chóng và hiệu quả.
Một khối OLAP cũng được gọi là "hypercube." Nó được mô tả là bao gồm các sự kiện số (biện pháp), được phân loại theo các khía cạnh (kích thước). Kích thước liên quan đến các thuộc tính xác định một vấn đề kinh doanh. Nói một cách đơn giản, kích thước là nhãn mô tả một biện pháp. Ví dụ: trong các báo cáo bán hàng, thước đo sẽ là khối lượng bán hàng và kích thước sẽ bao gồm thời gian bán hàng, người bán, sản phẩm hoặc dịch vụ và khu vực bán hàng. Trong báo cáo hoạt động sản xuất, biện pháp có thể là tổng chi phí sản xuất và đơn vị sản lượng. Kích thước sẽ là ngày hoặc thời gian sản xuất, giai đoạn sản xuất hoặc giai đoạn, thậm chí là các công nhân tham gia vào quá trình sản xuất.

Khối dữ liệu OLAP là nền tảng của hệ thống. Dữ liệu trong khối được tổ chức bằng cách sử dụng mô hình ngôi sao hoặc bông tuyết. Ở trung tâm có một bảng thực tế chứa các tập hợp (biện pháp). Nó được liên kết với một loạt các bảng đo chứa thông tin về các biện pháp. Kích thước mô tả làm thế nào các biện pháp này có thể được phân tích. Nếu một khối lập phương chứa nhiều hơn ba chiều, nó thường được gọi là hypercube.
Một trong những chức năng chính thuộc về khối là bản chất tĩnh của nó, ngụ ý rằng khối này không thể thay đổi sau khi phát triển. Do đó, quá trình xây dựng khối lập phương và thiết lập mô hình dữ liệu là một bước quan trọng đối với việc xử lý dữ liệu phù hợp trong kiến trúc OLAP.
Tổng hợp dữ liệu
Việc sử dụng các tập hợp là lý do chính tại sao các yêu cầu được xử lý nhanh hơn nhiều trong các công cụ OLAP (so với OLTP). Tập hợp là tổng hợp của dữ liệu đã được tính toán trước đó trong quá trình xử lý. Tất cả các thành viên được lưu trữ trong các bảng kích thước OLAP xác định các truy vấn mà khối có thể nhận được.
Trong một khối, tích lũy thông tin được lưu trữ trong các ô, tọa độ được xác định bởi các kích thước cụ thể. Số lượng tổng hợp mà một khối có thể chứa phụ thuộc vào tất cả các kết hợp có thể có của các yếu tố kích thước. Do đó, một khối điển hình trong một ứng dụng có thể chứa một số lượng tổng hợp cực lớn. Một tính toán sơ bộ sẽ chỉ được thực hiện đối với các tập hợp chính được phân phối trong toàn bộ khối phân tích trực tuyến. Điều này sẽ giảm đáng kể thời gian cần thiết để xác định bất kỳ tập hợp nào khi thực hiện truy vấn trong mô hình dữ liệu.
Ngoài ra còn có hai tùy chọn liên quan đến tập hợp mà bạn có thể cải thiện hiệu suất của khối hoàn chỉnh: tạo tập hợp bộ đệm khả năng và sử dụng tập hợp dựa trên phân tích yêu cầu của người dùng.
Nguyên tắc làm việc
Thông thường, việc phân tích thông tin hoạt động thu được từ các giao dịch có thể được thực hiện bằng bảng tính đơn giản (giá trị dữ liệu được trình bày theo hàng và cột). Điều này là tốt cho bản chất hai chiều của dữ liệu. Trong trường hợp OLAP, có sự khác biệt do mảng dữ liệu đa chiều.Bởi vì chúng thường được lấy từ các nguồn khác nhau, một bảng tính có thể không phải lúc nào cũng có thể xử lý chúng một cách hiệu quả.
Khối này giải quyết vấn đề này và cũng đảm bảo rằng kho dữ liệu OLAP hoạt động một cách hợp lý và có trật tự. Doanh nghiệp thu thập dữ liệu từ nhiều nguồn và được trình bày dưới nhiều định dạng như tệp văn bản, tệp đa phương tiện, bảng tính Excel, cơ sở dữ liệu Access và thậm chí cơ sở dữ liệu OLTP.

Tất cả dữ liệu được thu thập trong một kho lưu trữ được điền trực tiếp từ các nguồn. Trong đó, thông tin thô nhận được từ OLTP và các nguồn khác sẽ bị xóa khỏi mọi giao dịch sai lệch, không đầy đủ và không nhất quán.
Sau khi làm sạch và chuyển đổi, thông tin sẽ được lưu trữ trong cơ sở dữ liệu quan hệ. Sau đó, nó sẽ được tải lên máy chủ OLAP đa chiều (hoặc khối Olap) để phân tích. Người dùng cuối chịu trách nhiệm về các ứng dụng kinh doanh, khai thác dữ liệu và các hoạt động kinh doanh khác sẽ có quyền truy cập vào thông tin họ cần từ khối Olap.
Lợi ích mô hình mảng
OLAP là một công cụ cung cấp hiệu năng truy vấn nhanh, đạt được thông qua lưu trữ được tối ưu hóa, lập chỉ mục đa chiều và bộ nhớ đệm, đó là những lợi thế đáng kể của hệ thống. Ngoài ra, những lợi thế là:
- Dữ liệu nhỏ hơn trên đĩa.
- Tự động tính toán tổng hợp của một mức độ cao hơn của dữ liệu.
- Các mô hình mảng cung cấp chỉ mục tự nhiên.
- Lấy dữ liệu hiệu quả đạt được thông qua cấu trúc trước.
- Nhỏ gọn cho bộ dữ liệu chiều thấp.
Những nhược điểm của OLAP bao gồm thực tế là một số giải pháp (bước xử lý) có thể khá dài, đặc biệt là với lượng thông tin lớn. Điều này thường được sửa chữa bằng cách chỉ thực hiện xử lý gia tăng (dữ liệu đã được sửa đổi được nghiên cứu).
Hoạt động phân tích cơ bản
Kết luận (cuộn lên / khoan lên) còn được gọi là hợp nhất trực tuyến. Sự đông tụ liên quan đến việc thu thập tất cả các dữ liệu có thể thu được và tính toán tất cả theo một hoặc nhiều chiều. Thông thường, điều này có thể yêu cầu áp dụng một công thức toán học. Như một ví dụ OLAP, chúng ta có thể xem xét một mạng lưới bán lẻ với các cửa hàng ở các thành phố khác nhau. Để xác định các mô hình và dự đoán xu hướng bán hàng trong tương lai, dữ liệu về chúng từ tất cả các điểm đã được thu gọn lại vào bộ phận bán hàng chính của công ty để hợp nhất và tính toán.
Tiết lộ (khoan xuống). Điều này ngược lại với đông máu. Quá trình bắt đầu với một tập dữ liệu lớn và sau đó chia thành các phần nhỏ hơn, do đó cho phép người dùng xem chi tiết. Trong ví dụ về mạng bán lẻ, nhà phân tích sẽ phân tích dữ liệu bán hàng và xem xét các nhãn hiệu hoặc sản phẩm riêng lẻ được coi là bán chạy nhất ở mỗi cửa hàng ở các thành phố khác nhau.

Mục (Lát và xúc xắc). Đây là một quá trình khi các hoạt động phân tích bao gồm hai hành động: lấy ra một tập dữ liệu cụ thể từ khối OLAP (cắt theo khía cạnh phân tích) và xem nó từ các góc nhìn hoặc góc khác nhau. Điều này có thể xảy ra khi tất cả dữ liệu của các cửa hàng được nhận và nhập vào hypercube. Nhà phân tích cắt dữ liệu bán hàng từ OLAP Cube. Sau đó, nó sẽ được xem khi phân tích doanh số của các đơn vị riêng lẻ ở từng khu vực. Tại thời điểm này, những người dùng khác có thể tập trung vào việc đánh giá hiệu quả chi phí bán hàng hoặc đánh giá hiệu quả của chiến dịch tiếp thị và quảng cáo.
Biến (Xoay vòng). Các trục dữ liệu được xoay trong nó để cung cấp một sự thay thế cho việc trình bày thông tin.
Các loại cơ sở dữ liệu
Về nguyên tắc, đây là một khối OLAP điển hình thực hiện xử lý phân tích dữ liệu đa chiều bằng cách sử dụng OLAP Cube hoặc bất kỳ khối dữ liệu nào để quá trình phân tích có thể thêm kích thước khi cần. Mọi thông tin được tải lên cơ sở dữ liệu đa chiều sẽ được lưu trữ hoặc lưu trữ và có thể được gọi lên khi cần.
Loại OLAP | Giá trị |
OLAP quan hệ (ROLAP) | ROLAP là một DBMS tiên tiến cùng với ánh xạ dữ liệu đa chiều để thực hiện các hoạt động quan hệ tiêu chuẩn |
OLAP đa chiều (MOLAP) | MOLAP - thực hiện công việc trong dữ liệu đa chiều |
Lai phân tích trực tuyến (HOLAP) | Trong phương pháp HOLAP, tổng số tổng hợp được lưu trữ trong cơ sở dữ liệu đa chiều và thông tin chi tiết được lưu trữ trong cơ sở dữ liệu quan hệ. Điều này đảm bảo cả hiệu quả của mô hình ROLAP và hiệu suất của mô hình MOLAP. |
Máy tính để bàn OLAP (DOLAP) | Trong Desktop OLAP, người dùng tải một phần dữ liệu từ cơ sở dữ liệu cục bộ hoặc về máy tính để bàn của mình và phân tích nó. DOLAP tương đối rẻ hơn để triển khai vì nó cung cấp rất ít chức năng so với các hệ thống OLAP khác |
Web OLAP (WOLAP) | Web OLAP là một hệ thống OLAP có thể truy cập thông qua trình duyệt web. WOLAP là một kiến trúc ba tầng. Nó bao gồm ba thành phần: máy khách, phần mềm trung gian và máy chủ cơ sở dữ liệu |
OLAP di động | OLAP di động giúp người dùng nhận và phân tích dữ liệu OLAP bằng thiết bị di động của họ |
OLAP không gian | SOLAP được tạo ra để tạo điều kiện thuận lợi cho việc quản lý cả dữ liệu không gian và phi không gian trong hệ thống thông tin địa lý (GIS) |
Các hệ thống hoặc công nghệ OLAP ít nổi tiếng hơn tồn tại, nhưng đây là những hệ thống chính hiện đang được sử dụng bởi các tập đoàn lớn, cấu trúc kinh doanh và thậm chí cả chính phủ.

Công cụ OLAP
Các công cụ xử lý phân tích trực tuyến được trình bày rất tốt trên Internet dưới dạng cả phiên bản trả phí và miễn phí.
Phổ biến nhất trong số họ:
- Dundas BI từ Dundas Data Visualization là một nền tảng dựa trên trình duyệt dành cho kinh doanh thông minh và trực quan hóa dữ liệu, bao gồm bảng điều khiển tích hợp, công cụ báo cáo OLAP và phân tích dữ liệu.
- Yellowfin là một nền tảng kinh doanh thông minh, là một giải pháp tích hợp duy nhất được thiết kế cho các công ty thuộc các ngành công nghiệp và quy mô khác nhau. Hệ thống này được cấu hình cho các doanh nghiệp trong lĩnh vực kế toán, quảng cáo, nông nghiệp.
- ClicData là một giải pháp kinh doanh thông minh (BI) được thiết kế chủ yếu để sử dụng cho các doanh nghiệp vừa và nhỏ. Công cụ cho phép người dùng cuối tạo báo cáo và bảng điều khiển. Board được tạo ra để kết hợp trí tuệ kinh doanh, quản lý hiệu suất doanh nghiệp và là một hệ thống đầy đủ chức năng phục vụ các công ty cấp trung và công ty.
- Domo là gói quản lý doanh nghiệp dựa trên đám mây tích hợp với nhiều nguồn dữ liệu, bao gồm bảng tính, cơ sở dữ liệu, mạng xã hội và bất kỳ giải pháp phần mềm hoặc đám mây hiện có nào.
- InetSoft Style Intelligence là một nền tảng phần mềm thông minh cho doanh nghiệp, cho phép người dùng tạo bảng điều khiển, công nghệ phân tích OLAP trực quan và báo cáo bằng cơ chế mashup.
- Birst from Infor Company là một giải pháp kết nối cho các nhà phân tích và phân tích kinh doanh, kết hợp các ý tưởng của các nhóm khác nhau và giúp đưa ra quyết định sáng suốt. Công cụ cho phép người dùng phi tập trung tăng mô hình của các nhóm công ty.
- Halo là một hệ thống quản lý chuỗi cung ứng và kinh doanh toàn diện giúp lập kế hoạch kinh doanh và dự báo hàng tồn kho cho quản lý chuỗi cung ứng. Hệ thống sử dụng dữ liệu từ tất cả các nguồn - lớn, nhỏ và trung gian.
- Chartio là một giải pháp kinh doanh thông minh dựa trên đám mây, cung cấp cho người sáng lập, nhóm kinh doanh, nhà phân tích dữ liệu và nhóm sản phẩm với các công cụ tổ chức cho công việc hàng ngày.
- Exago BI là một giải pháp dựa trên web được thiết kế để thực hiện trong các ứng dụng web. Việc triển khai Exago BI cho phép các công ty thuộc mọi quy mô cung cấp cho khách hàng của họ báo cáo đặc biệt, kịp thời và tương tác.
Tác động kinh doanh
Người dùng sẽ tìm thấy OLAP trong hầu hết các ứng dụng kinh doanh trong các ngành công nghiệp.Phân tích được sử dụng không chỉ bởi doanh nghiệp, mà còn bởi các bên quan tâm khác.

Một số ứng dụng phổ biến nhất của nó bao gồm:
- Tiếp thị phân tích dữ liệu OLAP.
- Báo cáo tài chính bao gồm doanh thu và chi phí, lập ngân sách và lập kế hoạch tài chính.
- Quản lý quy trình kinh doanh.
- Phân tích bán hàng.
- Tiếp thị cơ sở dữ liệu.
Các ngành công nghiệp tiếp tục phát triển, có nghĩa là người dùng sẽ sớm thấy nhiều ứng dụng OLAP hơn. Xử lý phù hợp đa chiều cung cấp phân tích năng động hơn. Vì lý do này, các hệ thống và công nghệ OLAP này được sử dụng để đánh giá các kịch bản giả định và kịch bản kinh doanh thay thế.