Luận văn: NGHIÊN CỨU CÁC PHƯƠNG PHÁP TRÍCH RÚT VĂN BẢN TỪ TRANG WEB VÀ ỨNG DỤNG

Luận văn - Đề tài tham khảo,Luận văn - Đề tài Cao học
  Đánh giá    Viết đánh giá
 51      618      0
Phí: Tải Miễn phí
Mã tài liệu
e0xntq
Danh mục
Luận văn - Đề tài tham khảo,Luận văn - Đề tài Cao học
Thể loại
rút trích văn bản, rút trích từ web, luận văn
Ngày đăng
23/3/2014
Loại file
pdf
Số trang
26
Dung lượng
0.59 M
Lần xem
618
Lần tải
51
  DOWNLOAD

Sự phát triển nhanh chóng của mạng Web toàn cầu đã sinh ra một khối lượng khổng lồ các dữ liệu dưới dạng siêu văn bản là các trang web. Trong khi dữ liệu trong các cơ sở dữ liệu (CSDL) truyền thống thường là loại dữ liệu đồng nhất (về ngôn ngữ, định dạng,…), còn dữ liệu Web thường không đồng nhất.

HƯỚNG DẪN DOWNLOAD TÀI LIỆU

Bước 1:Tại trang tài liệu thuvienmienphi bạn muốn tải, click vào nút Download màu xanh lá cây ở phía trên.
Bước 2: Tại liên kết tải về, bạn chọn liên kết để tải File về máy tính. Tại đây sẽ có lựa chọn tải File được lưu trên thuvienmienphi
Bước 3: Một thông báo xuất hiện ở phía cuối trình duyệt, hỏi bạn muốn lưu . - Nếu click vào Save, file sẽ được lưu về máy (Quá trình tải file nhanh hay chậm phụ thuộc vào đường truyền internet, dung lượng file bạn muốn tải)
Có nhiều phần mềm hỗ trợ việc download file về máy tính với tốc độ tải file nhanh như: Internet Download Manager (IDM), Free Download Manager, ... Tùy vào sở thích của từng người mà người dùng chọn lựa phần mềm hỗ trợ download cho máy tính của mình  

NỘI DUNG TÀI LIỆU

Luận văn: NGHIÊN CỨU CÁC PHƯƠNG PHÁP TRÍCH RÚT VĂN BẢN TỪ TRANG WEB VÀ ỨNG DỤNG

 

HÌNH ẢNH DEMO
Tài liệu Luận văn: NGHIÊN CỨU CÁC PHƯƠNG PHÁP TRÍCH RÚT VĂN BẢN  TỪ TRANG WEB VÀ ỨNG DỤNG slide 1

Tài liệu Luận văn: NGHIÊN CỨU CÁC PHƯƠNG PHÁP TRÍCH RÚT VĂN BẢN  TỪ TRANG WEB VÀ ỨNG DỤNG slide 2

Tài liệu Luận văn: NGHIÊN CỨU CÁC PHƯƠNG PHÁP TRÍCH RÚT VĂN BẢN  TỪ TRANG WEB VÀ ỨNG DỤNG slide 3

Tài liệu Luận văn: NGHIÊN CỨU CÁC PHƯƠNG PHÁP TRÍCH RÚT VĂN BẢN  TỪ TRANG WEB VÀ ỨNG DỤNG slide 4

Tài liệu Luận văn: NGHIÊN CỨU CÁC PHƯƠNG PHÁP TRÍCH RÚT VĂN BẢN  TỪ TRANG WEB VÀ ỨNG DỤNG slide 5


Chỉ xem 5 trang đầu, hãy download Miễn Phí về để xem toàn bộ

HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG
----------------~~~~0~~~~----------------
NGUYỄN THỊ TRANG
NGHIÊN CỨU CÁC PHƯƠNG PHÁP TRÍCH RÚT VĂN BẢN
TỪ TRANG WEB VÀ ỨNG DỤNG
Chuyên ngành: Hệ thống thông tin
Mã số:
60.48.01.04
TÓM TẮT LUẬN VĂN THẠC SĨ
HÀ NỘI - NĂM 2013
Luận văn được hoàn thành tại:
HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG
Người hướng dẫn khoa học: T.S Hoàng Xuân Dậu
Phản biện 1: ……………………………………………………………………………
Phản biện 2: …………………………………………………………………………..
Luận văn sẽ được bảo vệ trước Hội đồng chấm luận văn thạc sĩ tại Học viện Công nghệ Bưu chính
Viễn thông
Vào lúc:
....... giờ ....... ngày ....... tháng ....... .. năm ...............
Có thể tìm hiểu luận văn tại:
- Thư viện của Học viện Công nghệ Bưu chính Viễn thông
Trang 1
MỞ ĐẦU
Sự phát triển nhanh chóng của mạng Web toàn cầu đã sinh ra một khối lượng
khổng lồ các dữ liệu dưới dạng siêu văn bản là các trang web. Trong khi dữ liệu trong
các cơ sở dữ liệu (CSDL) truyền thống thường là loại dữ liệu đồng nhất (về ngôn ngữ,
định dạng,…), còn dữ liệu Web thường không đồng nhất. Ví dụ về ngôn ngữ, dữ liệu
Web bao gồm nhiều loại ngôn ngữ khác nhau (cả ngôn ngữ diễn tả nội dung lẫn ngôn
ngữ lập trình), nhiều loại định dạng khác nhau (văn bản, HTML, PDF, hình ảnh, âm
thanh,…), nhiều loại từ vựng khác nhau (địa chỉ email, các liên kết (links), các mã
vùng (zipcode), số điện thoại). Nói cách khác, trang Web thiếu một cấu trúc thống
nhất. Chúng được coi như một thư viện kỹ thuật số rộng lớn, tuy nhiên con số khổng lồ
các tài liệu trong thư viện thì không được sắp xếp tuân theo một tiêu chuẩn đặc biệt
nào, không theo phạm trù, tiêu đề, tác giả, số trang hay nội dung... Do dữ liệu We
không có cấu trúc và thường không đồng nhất nên việc xử lý thông tin trên web phục
vụ các yêu cầu tìm kiếm, phân tích thông tin gặp nhiều khó khăn. Yêu cần thiết phải
nghiên cứu các phương pháp hiệu quả để xử lý dữ liệu Web, chuyển từ dạng dữ liệu
không có cấu trúc, không đồng nhất thành dạng dữ liệu có cấu trúc và đồng nhất hơn.
Bước xử lý này có thể được ứng dụng cho nhiều lĩnh vực như dịch tự động và xử lý
ngôn ngữ tự nhiên.
Luận văn tập trung
nghiên cứu các phương pháp trích xuất dữ liệu từ Web. Trên
cơ sở đó, thực hiện cài đặt thử nghiệm công cụ trích rút thông tin từ các trang tin tức
tiếng Việt.
Nội dung luận văn được chia thành 3 chương chính:
Chương 1 – Khái quát về khai phá dữ liệu web. Chương này giới thiệu những nội
dung cơ bản nhất, cung cấp một cái nhìn khái quát về khai phá dữ liệu Web. Đồng thời,
luận văn cũng mô tả sơ bộ các hướng khai phá, các lĩnh vực cũng như bài toán đặt ra
trong khai phá dữ liệu Web.
Chương 2 – Các kỹ thuật trích rút văn bản từ trang Web. Chương này trình bày
một cách chi tiết về trích rút thông tin. Đồng thời chương này đưa ra các hướng tiếp
cận trong bài toán trích rút thông tin. Các phương pháp trích lọc văn bản từ Web cũng
được trình bày trong chương này.

Nguồn: thuvienmienphi

 

Bạn phải gởi bình luận/ đánh giá để thấy được link tải

Nếu bạn chưa đăng nhập xin hãy chọn ĐĂNG KÝ hoặc ĐĂNG NHẬP
 
 

BÌNH LUẬN


Nội dung bậy bạ, spam tài khoản sẽ bị khóa vĩnh viễn, IP sẽ bị khóa.
Đánh giá(nếu muốn)
 BÌNH LUẬN

ĐÁNH GIÁ


ĐIỂM TRUNG BÌNH

0
0 Đánh giá
Tài liệu rất tốt (0)
Tài liệu tốt (0)
Tài liệu rất hay (0)
Tài liệu hay (0)
Bình thường (0)
Thành viên
Nội dung đánh giá

 
LINK DOWNLOAD

Luan-van-NGHIEN-CUU-CAC-PHUoNG-PHAP-TRICH-RUT-VAN-BAN-TU-TRANG-WEB-VA-UNG-DUNG.pdf[0.59 M]

File đã kiểm duyệt
     Báo vi phạm bản quyền
Pass giải nén (Nếu có):
thuvienmienphi.com
DOWNLOAD
(Miễn phí)

Tài liệu tương tự