Luận văn tốt nghiệp: Khai phá dữ liệu Web và máy tìm kiếm Luận văn - Đề tài tham khảo,Luận văn - Đề tài CĐ - ĐH

  Đánh giá    Viết đánh giá
 0      0      0
Phí: Tải Miễn phí
Mã tài liệu
0mxntq
Danh mục
Luận văn - Đề tài tham khảo,Luận văn - Đề tài CĐ - ĐH
Thể loại
tài liệu, luận văn, đề tài, tài liệu tham khảo
Ngày đăng
7/3/2014
Loại file
pdf
Số trang
68
Dung lượng
1.52 M
Lần xem
0
Lần tải
0
  DOWNLOAD

Ngày nay, sự phát triển nhanh chóng của mạng Internet và Intranet đã sinh ra một khối lượng khổng lồ các dữ liệu dạng siêu văn bản (dữ liệu Web). Trong những năm gần đây Intrnet đã trở thành một trong những kênh về khoa học, thông tin kinh tế, thương mại và quảng cáo. Một trong những lý do

HƯỚNG DẪN DOWNLOAD TÀI LIỆU

Bước 1:Tại trang tài liệu thuvienmienphi bạn muốn tải, click vào nút Download màu xanh lá cây ở phía trên.
Bước 2: Tại liên kết tải về, bạn chọn liên kết để tải File về máy tính. Tại đây sẽ có lựa chọn tải File được lưu trên thuvienmienphi
Bước 3: Một thông báo xuất hiện ở phía cuối trình duyệt, hỏi bạn muốn lưu . - Nếu click vào Save, file sẽ được lưu về máy (Quá trình tải file nhanh hay chậm phụ thuộc vào đường truyền internet, dung lượng file bạn muốn tải)
Có nhiều phần mềm hỗ trợ việc download file về máy tính với tốc độ tải file nhanh như: Internet Download Manager (IDM), Free Download Manager, ... Tùy vào sở thích của từng người mà người dùng chọn lựa phần mềm hỗ trợ download cho máy tính của mình  

NỘI DUNG TÀI LIỆU

Luận văn tốt nghiệp: Khai phá dữ liệu Web và máy tìm kiếm

 

HÌNH ẢNH DEMO
Tài liệu Luận văn tốt nghiệp: Khai phá dữ liệu Web và máy tìm kiếm slide 1

Tài liệu Luận văn tốt nghiệp: Khai phá dữ liệu Web và máy tìm kiếm slide 2

Tài liệu Luận văn tốt nghiệp: Khai phá dữ liệu Web và máy tìm kiếm slide 3

Tài liệu Luận văn tốt nghiệp: Khai phá dữ liệu Web và máy tìm kiếm slide 4

Tài liệu Luận văn tốt nghiệp: Khai phá dữ liệu Web và máy tìm kiếm slide 5


Chỉ xem 5 trang đầu, hãy download Miễn Phí về để xem toàn bộ

Luận
văn
tốt
nghiệp
Khai
phá
dữ
liệu
We

máy
tìm kiếm
Mục lục
Mục lục....................................................................................................................1
Chương 1. Tổng quan về khai phá dữ liệu Web và máy tìm kiếm...................4
1.1. Khai phá dữ liệu Web...........................................................................................4
1.1.1. Tổng quan về khai phá dữ liệu Web.............................................................4
1.1.2
Các bài toán được đặt ra trong khai phá Web............................................5
1.1.3
Các lĩnh vực của khai phá dữ liệu Web........................................................6
1.1.3.1 Khai phá nội dung Web (Web content mining):...............................................6
1.1.3.2. Khai phá cấu trúc web (web structure mining): ..............................................6
1.1.3.3 Khai phá sử dụng web (web usage mining). ....................................................7
1.1.4. Khó khăn.......................................................................................................7
1.1.4.1 Web dường như quá lớn để tổ chức thành kho dữ liệu phục vụ Dataming......7
1.1.4.2. Độ phức tạp của trang Web lớn hơn rất nhiều so với những tài liệu văn bản
truyền thống khác.........................................................................................................8
1.1.4.3. Web là một nguồn tài nguyên thông tin có độ thay đổi cao............................8
1.1.4.4. Web phục vụ một cộng đồng người dùng rộng lớn và đa dạng......................8
1.1.4.5. Chỉ một phần rất nhỏ của thông tin trên Web là thực sự hữu ích....................9
1.1.5. Thuận lợi.......................................................................................................9
1.2 Tổng quan về máy tìm kiếm..................................................................................9
1.2.1 Nhu cầu:.........................................................................................................9
1.2.2 Cơ chế hoạt động của máy tìm kiếm. ..........................................................10
1.2.3 Cấu trúc điển hình của một máy tìm kiếm...................................................11
Chương 3. Tổng quan về xử lý song song.......................................................34
3.1 Máy tính song song.............................................................................................34
3.1.2 Phân loại máy tính song song......................................................................35
3.1.2.1 Phân loại dựa trên cơ chế điều khiển chung...................................................35
3.1.2.2 Cách phân loại dựa trên sự tương tác giữa các BXL......................................37
3.2 Mô hình lập trình song song................................................................................38
3.2.1 Mô hình nhiệm vụ - kênh liên lạc................................................................38
3.2.1.1 Đặc điểm mô hình nhiệm vụ-kênh liên lạc.....................................................38
3.2.1.2 Đặc điểm của mô hình nhiệm vụ - kênh liên lạc............................................39
3.2.2 Mô hình chia sẻ bộ nhớ chung.....................................................................40
3.3. Hiệu năng của xử lý song song..........................................................................40
3.3.1 Khả năng tăng tốc độ tính toán:...................................................................40
3.3.3 Cân bằng tải.................................................................................................43
3.3.4 Sự bế tắc.......................................................................................................44
3.4 Môi trường lập trình song song...........................................................................45
3.4.1 Mô hình MPI (Message Passing Interface). ................................................46
3.4.2 PVM (Parallel Virtual Machine)......................................................................46
3.4.3 So sánh giữa MPI và PVM..........................................................................46
3.5 Giao thức truyền thông điệp MPI........................................................................47
Chương 2: Giới thiệu về module Crawler trong các máy tìm kiếm. ..............13
2.1 Tổng quan:...........................................................................................................13
2.2 Cấu trúc cơ bản của một crawler.........................................................................15
2.2.1 Frontier.........................................................................................................16
2.2.2 History và kho chứa trang web....................................................................17
2.2.3 Tải các trang web (fetching)........................................................................18
2.2.4 Duyệt nội dung (parsing).............................................................................19
2.2.4.1. Quá trình lấy ra và chuẩn hóa các URL.........................................................20
2.2.4.2 Loại bỏ các từ dừng và chuyển các dạng thức của từ sang dạng gốc.............21
2.2.4.3 Xây dựng cây các thẻ HTML.........................................................................21
2.3 Các crawler đa luồng (Multi-threaded crawlers). ...............................................22
2.4. Các thuật toán crawling......................................................................................24
2.4.1 Thuật toán Naïve tốt nhất đầu tiên...............................................................24
2.4.2 Thuật toán SharkSearch...............................................................................25
2.4.3 Crawler có trọng tâm (focused crawler)......................................................26
2.3.4 Các crawler tập trung theo ngữ cảnh (context focused crawler).................27
2.4. Các tiêu chuẩn đánh giá các crawler..................................................................29
2.4.1 Độ quan trọng của trang web...........................................................................29
2.4.2 Các phân tích tổng hợp.....................................................................................31
Chương 4. Giới thiệu về máy tìm kiếm ASPseek và đề xuất giải pháp song
song hóa. ..............................................................................................................50
4.1 Giới thiệu chung về máy tìm kiếm ASPseek......................................................50
4.1.1 Một số tính năng của ASPseek....................................................................50
4.1.2 Các thành phần của ASPseek.......................................................................51
a. Module đánh chỉ số (indexing)...............................................................................51
. Module tìm kiếm (searchd).....................................................................................52
c. Module tìm kiếm s.cgi............................................................................................52
4.2 Cấu trúc cơ sở dữ liệu trong máy tìm kiếm ASPseek.........................................52
4.2.1 Cấu trúc một số bảng chính trong cơ sở dữ liệu của ASPseek....................53
4.2.2 Cấu trúc một số file nhị phân trong cơ sở dữ liệu của ASPseek .................56
4.2.2.1 Cấu trúc các file nhị phân trong thư mục xxw: ..............................................56
4.3 Tìm hiểu về việc thực thi quá trình crawler trong module index của máy tìm
kiếm VietSeek...........................................................................................................60

Nguồn: thuvienmienphi

 

Bạn phải gởi bình luận/ đánh giá để thấy được link tải

Nếu bạn chưa đăng nhập xin hãy chọn ĐĂNG KÝ hoặc ĐĂNG NHẬP
 
 

BÌNH LUẬN


Nội dung bậy bạ, spam tài khoản sẽ bị khóa vĩnh viễn, IP sẽ bị khóa.
Đánh giá(nếu muốn)
 BÌNH LUẬN

ĐÁNH GIÁ


ĐIỂM TRUNG BÌNH

0
0 Đánh giá
Tài liệu rất tốt (0)
Tài liệu tốt (0)
Tài liệu rất hay (0)
Tài liệu hay (0)
Bình thường (0)
Thành viên
Nội dung đánh giá

 
LINK DOWNLOAD

Luan-van-tot-nghiep-Khai-pha-du-lieu-Web-va-may-tim-kiem.pdf[1.52 M]

File đã kiểm duyệt
     Báo vi phạm bản quyền
Pass giải nén (Nếu có):
thuvienmienphi.com
DOWNLOAD
(Miễn phí)

Tài liệu tương tự