Khám phá dữ liệu trong việc hỗ trợ hoạch định chiến lược phát triển du lịch
Khám phá dữ liệu trong việc hỗ trợ hoạch định chiến lược phát triển du lịch
Thứ ba, 17/04/2007 | 10:05 GMT+7
Trong những năm gần đây, sự phát triển mạnh mẽ của CNTT đã làm cho khả năng thu thập và lưu trữ thông tin của các hệ thống thông tin tăng nhanh một cách chóng mặt. Bên cạnh đó, việc tin học hóa một cách ồ ạt và nhanh chóng các hoạt động sản xuất, kinh doanh cũng như nhiều lĩnh vực hoạt động khác đã tạo ra cho chúng ta một lượng dữ liệu lưu trữ khổng lồ. Hàng triệu CSDL đã được sử dụng trong các hoạt động sản xuất, kinh doanh, quản lý..., trong đó có nhiều CSDL cực lớn cỡ Gigabyte, thậm chí là Terabyte.
Sự bùng nổ này đã dẫn tới một yêu cầu cấp thiết là cần có những kỹ thuật và công cụ mới để tự động chuyển đổi lượng dữ liệu khổng lồ kia thành các tri thức có ích. Từ đó, các kỹ thuật khai phá dữ liệu đã trở thành một lĩnh vực thời sự của nền CNTT thế giới hiện nay nói chung và Việt Nam nói riêng.
Khai phá dữ liệu đang được áp dụng một cách rộng rãi trong nhiều lĩnh vực kinh doanh và đời sống khác nhau: marketing, tài chính, ngân hàng và bảo hiểm, khoa học, y tế, an ninh, internet… Rất nhiều tổ chức và công ty lớn trên thế giới đã áp dụng kỹ thuật khai phá dữ liệu vào các hoạt động sản xuất kinh doanh của mình và thu được những lợi ích to lớn.
Các kỹ thuật khai phá dữ liệu thường được chia thành 2 nhóm chính:
- Kỹ thuật khai phá dữ liệu mô tả: có nhiệm vụ mô tả về các tính chất hoặc các đặc tính chung của dữ liệu trong CSDL hiện có.
- Kỹ thuật khai phá dữ liệu dự đoán: có nhiệm vụ đưa ra các dự đoán dựa vào các suy diễn trên dữ liệu hiện thời.
Dưới đây giới thiệu 3 phương pháp thông dụng nhất là: phân cụm dữ liệu, phân lớp dữ liệu và khai phá luật kết hợp.
- Phân cụm dữ liệu: Mục tiêu chính của phương pháp phân cụm dữ liệu là nhóm các đối tượng tương tự nhau trong tập dữ liệu vào các cụm sao cho các đối tượng thuộc cùng một lớp là tương đồng còn các đối tượng thuộc các cụm khác nhau sẽ không tương đồng.
- Phân lớp dữ liệu và hồi quy: Mục tiêu của phương pháp phân lớp dữ liệu là dự đoán nhãn lớp cho các mẫu dữ liệu. Quá trình phân lớp dữ liệu thường gồm 2 bước: Thứ nhất, xây dựng mô hình, một mô hình sẽ được xây dựng dựa trên việc phân tích các mẫu dữ liệu sẵn có. Mỗi mẫu tương ứng với một lớp, được quyết định bởi một thuộc tính gọi là thuộc tính lớp. Thứ hai, sử dụng mô hình để phân lớp dữ liệu, tính độ chính xác của mô hình. Nếu độ chính xác là chấp nhận được, mô hình sẽ được sử dụng để dự đoán nhãn lớp cho các mẫu dữ liệu khác trong tương lai.
- Khai phá luật kết hợp: mục tiêu của phương pháp này là phát hiện và đưa ra các mối liên hệ giữa các giá trị dữ liệu trong CSDL. Mẫu đầu ra của giải thuật khai phá dữ liệu là tập luật kết hợp tìm được. Khai phá luật kết hợp được thực hiện qua 2 bước: Thứ nhất, tìm tất cả các tập mục phổ biến, một tập mục phổ biến được xác định qua tính độ hỗ trợ và thỏa mãn độ hỗ trợ cực tiểu. Thứ hai, sinh ra các luật kết hợp mạnh từ tập mục phổ biến, các luật phải thỏa mãn độ hỗ trợ cực tiểu và độ tin cậy cực tiểu.
Ứng dụng công nghệ khai phá dữ liệu trong hoạch định chiến lược phát triển ngành Du lịch
Du lịch là ngành có tỷ lệ tin học hóa chưa cao, hầu hết các giao dịch, thao tác, hoạt động đều thực hiện trực tiếp, hoặc có lưu được trong CSDL máy tính thì chỉ là những CSDL đơn lẻ, chưa có sự tổng hợp tự động trên toàn Ngành. Trong những năm tới, để phát triển và cạnh tranh trong xu thế hội nhập, đặc biệt trong điều kiện Việt Nam đã trở thành thành viên chính thức của WTO thì cần phải có những hoạch định chính sách phát triển du lịch mang tính chất cạnh tranh, dài hơi hơn. Vì thế, cần tổng hợp rất nhiều thông tin trên toàn Ngành, tổng hợp các thông tin trên thị trường liên quan trong nước và ngoài nước như giá dịch vụ hàng không, xe lửa, ô tô, xu thế phát triển kinh tế thế giới… và dựa vào đó để xử lý và hoạch định chiến lược.
Đối với ngành Du lịch, thị phần và khách hàng là hai yếu tố hết sức quan trọng, quyết định sự thành công của doanh nghiệp. Chính vì vậy, việc nắm bắt được các nhu cầu, sở thích của khách hàng cũng như những xu hướng, biến động của thị trường sẽ là một lợi thế to lớn cho các doanh nghiệp trong việc cạnh tranh và mở rộng thị trường của mình. Bên cạnh đó, cùng với sự phát triển của các kỹ thuật, công nghệ, những gian lận trong việc sử dụng dịch vụ du lịch, những chiến lược cạnh tranh trong nước và ngoài nước cũng gia tăng theo và gây ra những thiệt hại đáng kể cho Ngành.
Giải pháp ứng dụng DataMining trong ngành Du lịch
Sau quá trình nghiên cứu về tình hình kinh doanh cho thấy rằng cần có một hệ thống CNTT áp dụng kỹ thuật khai phá dữ liệu vào hoạch định chiến lược phát triển của ngành Du lịch. Hệ thống này gồm có bốn chức năng chính sau:
- Dự đoán các dịch vụ du lịch có xu hướng phát triển mạnh ở từng tỉnh, thành phố.
- Phân tích và dự đoán xu hướng phát triển của các sản phẩm, dịch vụ có lợi nhuận lớn nhất trong thời điểm hiện tại.
- Dự đoán lượng khách du lịch nước ngoài và nội địa
- Một chức năng nữa của hệ thống là thu thập và phân tích các thị hiếu, những phong tục tập quán của từng nhóm khách hàng hiện tại và tương lai.
Khai phá dữ liệu là lĩnh vực đã và đang trở thành một trong những hướng nghiên cứu thu hút được sự quan tâm của nhiều chuyên gia về CNTT trên thế giới. Trong những năm gần đây, rất nhiều các phương pháp và thuật toán mới liên tục được công bố. Điều này chứng tỏ những ưu thế, lợi ích và khả năng ứng dụng thực tế to lớn của khai phá dữ liệu trong hoạch định chiến lược phát triển ngành Du lịch Việt Nam.
Ths. NGUYỄN VĂN CĂN