Monday, Aug 20th

Luận văn - Luận án Luận án Tiến sĩ Phân lớp dữ liệu bằng cây quyết định mờ dựa trên đại số gia tử

Phân lớp dữ liệu bằng cây quyết định mờ dựa trên đại số gia tử

Họ và tên nghiên cứu sinh: Lê Văn Tường Lân

Tên đề tài luận án: Phân lớp dữ liệu bằng cây quyết định mờ dựa trên đại số gia tử.

Chuyên ngành: Khoa học Máy tính

Mã số: 62.48.01.01

Tập thể hướng dẫn:

1. PGS. TS. Nguyễn Mậu Hân, Trường Đại học Khoa học, Đại học Huế

2. TS. Nguyễn Công Hào, Đại học Huế.

Cơ sở đào tạo: Trường Đại học Khoa học, Đại học Huế

1. Đề xuất mô hình linh hoạt cho quá trình học cây quyết định từ tập mẫu huấn luyện thực tế và phương pháp nhằm trích chọn được tập mẫu huấn luyện đặc trưng phục vụ cho quá trình huấn luyện.

2. Phân tích, đưa ra các khái niệm về giá trị ngoại lai trong tập mẫu không thuần nhất, xây dựng thuật toán để có thể thuần nhất cho các thuộc tính có chứa các giá trị này.

3. Đề xuất các thuật toán học MixC4.5 và FMixC4.5: trên cơ sở tổng hợp các ưu và nhược điểm của các thuật toán truyền thống CART, C4.5, SLIQ, SPRINT.

4. Đề xuất phương pháp đối sánh dựa trên khoảng mờ và xây dựng thuật toán học phân lớp dựa trên khoảng mờ HAC4.5. Xây dựng phương pháp nhằm có thể định lượng cho các giá trị của thuộc tính không thuần nhất, chưa xác định Min-Max của tập huấn luyện.

5. Luận án đề xuất khái niệm khoảng mờ lớn nhất và sử dụng làm cơ sở để thiết kế thuật toán học cây quyết định dựa trên khoảng mờ lớn nhất HAC4.5* nhằm đồng thời đạt được các mục tiêu đó là tính hiệu quả của quá trình phân lớp và tính đơn giản đối với người dùng.

 

Full name: Lê Văn Tường Lân

Topic: Data classification by fuzzy decision tree base on hedge algebra

Major: Computer Science

Code: 62.48.01.01

Supervisors:

Assoc. Prof. Dr. Nguyễn Mậu Hân,

Faculty of Information Technology, Hue University of Sciences

Dr. Nguyễn Công Hào,

Department of Inspection and Legislation, Hue University

Institution: Hue University of Sciences, Vietnam

NOVEL CONTRIBUTIONS OF THE DISSERTATION

1. Propose a flexible model for decision tree learning from a practical training dataset and a method to extract a specific training set for the training process.

2. Analyze and introduce the concept of extrinsic value in heterogeneous sample datasets. Developing the algorithms to uniform these attributes that contain these values.

3. Proposed MixC4.5 and FMixC4.5learning algorithms: based on the synthesis of the advantages and disadvantages of traditional algorithms (CART, C4.5, SLIQ, SPRINT).

4. Proposed a matching solution onfuzzy distance, and afuzzy clustering algorithm based on a HAC4.5 fuzzy distance. Develop a method to quantify the values of the non-uniform, unspecified Min-Max attributes of the training set.

5. The thesis proposes the largest fuzzy distance concept and is used as the basis to develop the decision tree algorithms based on the largest fuzzy distance HAC4.5* to achieve the efficient classification and the simplicity for the user.

File đính kèm:
Download this file (DongGop_EN.pdf)DongGop_EN.pdf[ ]133 Kb
Download this file (DongGop_VN.pdf)DongGop_VN.pdf[ ]115 Kb
Download this file (LuanAn.pdf)LuanAn.pdf[ ]1714 Kb
Download this file (TomTat_EN.pdf)TomTat_EN.pdf[ ]542 Kb
Download this file (TomTat_VN.pdf)TomTat_VN.pdf[ ]542 Kb