Bạn có phải là người mới sử dụng Linux không?Bạn có đang tìm kiếm một công cụ dòng lệnh có thể giúp bạn tải xuống các tệp từ Web không? Nếu câu trả lời của bạn cho cả hai câu hỏi này là có, thì bạn đã đến đúng nơi, vì trong hướng dẫn này, chúng tôi sẽ thảo luận về cách sử dụng cơ bản của tiện ích dòng lệnh WGET.
Xin lưu ý rằng tất cả các ví dụ và hướng dẫn được đề cập trong bài viết này đã được thử nghiệm trên Ubuntu 18.04 LTS, Debian 10 và CentOS 8.
Wget cũng cho phép truy xuất thông qua proxy HTTP và "có thể theo các liên kết trong các trang HTML, XHTML và CSS để tạo phiên bản cục bộ của các trang web từ xa, tạo lại hoàn toàn cấu trúc thư mục của trang web gốc."
Sau đây là ảnh chụp màn hình mẫu:
Sau đây là ảnh chụp màn hình mẫu (xem lệnh thứ hai):
Vì vậy, bạn có thể thấy rằng khi lệnh wget được chạy lần thứ hai với tùy chọn -c, quá trình tải xuống bắt đầu từ cùng một điểm mà nó đã dừng lại. Lưu ý rằng tùy chọn này cũng hoạt động khi bạn muốn hoàn tất quá trình tải xuống được bắt đầu bởi một chương trình khác ngoài wget.
Đây là ảnh chụp màn hình mẫu:
Sau đây là ảnh chụp nhanh mẫu:
Như bạn có thể thấy trong ảnh chụp màn hình ở trên, không có đầu ra hoặc thông báo nào được hiển thị trên đầu ra chuẩn. Nguyên nhân là do tất cả các thông báo đang được chuyển hướng đến tệp nhật ký có tên là ‘abc.log’.
Bạn có thể xem tệp nhật ký bằng lệnh cat.
Sau đây là nội dung tệp nhật ký trong trường hợp của chúng tôi:
Sau đây là một ví dụ:
Lưu ý rằng bạn có thể thay đổi tên tệp bằng cách sử dụng tùy chọn -o (chữ thường) mà chúng tôi đã giải thích trước đó.
Sau đây là ví dụ giới hạn tốc độ tải xuống của wget ở mức 50k:
Đây là một ví dụ:
Đây là một ví dụ:
Như bạn có thể thấy trong ảnh chụp màn hình ở trên, wget đã bỏ cuộc sau hai lần thử.
LƯU Ý: Tính năng này đi kèm với ngoại lệ của các lỗi nghiêm trọng như "connection denied" hoặc "not found" (404), không được thử lại.
Sau đây là một ví dụ:
Tùy chọn --progress cho phép bạn chọn loại chỉ báo trong trường hợp bạn muốn ghi đè hành vi mặc định. Ví dụ:
Đây là một ảnh chụp màn hình mẫu:
Tiếp theo, tùy thuộc vào kích thước tệp bạn đang tải xuống, bạn cũng có thể điều chỉnh cách hiển thị đồng hồ đo tiến trình tải xuống.
$ wget -–progress=[type]:[parameter]
'type' có thể là bar hoặc dot trong khi 'parameter' có thể là default, binary, mega hoặc giga.
Ví dụ: nếu bạn muốn đặt 'type' của mình là dot và 'parameter' là binary, thì bạn có thể sử dụng lệnh sau lệnh:
$ wget -–progress=dot:binary Đây là một ví dụ: Lưu ý rằng t...tm_source=diendancongnghe.com]trang hướng dẫn của lệnh.
Xin lưu ý rằng tất cả các ví dụ và hướng dẫn được đề cập trong bài viết này đã được thử nghiệm trên Ubuntu 18.04 LTS, Debian 10 và CentOS 8.
Giới thiệu về wget
Wget về cơ bản là một công cụ dòng lệnh cho phép tải xuống các tệp không tương tác từ Internet. Không tương tác có nghĩa là tiện ích có thể hoạt động ở chế độ nền khi người dùng không đăng nhập. Các giao thức được hỗ trợ bao gồm HTTP, HTTPS và FTP.Wget cũng cho phép truy xuất thông qua proxy HTTP và "có thể theo các liên kết trong các trang HTML, XHTML và CSS để tạo phiên bản cục bộ của các trang web từ xa, tạo lại hoàn toàn cấu trúc thư mục của trang web gốc."
Lệnh wget hoạt động như thế nào?
Các phần sau đây giải thích cách sử dụng cơ bản của công cụ Wget cũng như một số tính năng của công cụ này.1. Cách tải xuống tệp bằng wget
Tệp mà công cụ tải xuống sẽ được lưu trong thư mục làm việc hiện tại của người dùng. Sau đây là cách bạn có thể sử dụng Wget để tải xuống tệp:
Mã:
wget [URL]
2. Cách tiếp tục tải xuống bằng wget
Trong trường hợp quá trình tải xuống đang diễn ra của bạn bị gián đoạn do kết nối internet kém hoặc bất kỳ lý do nào khác, bạn có thể tiếp tục bằng cách chạy lại lệnh tương tự nhưng với tùy chọn dòng lệnh -c:
Mã:
wget [B]-c[/b] [URL]
Sau đây là ảnh chụp màn hình mẫu (xem lệnh thứ hai):
Vì vậy, bạn có thể thấy rằng khi lệnh wget được chạy lần thứ hai với tùy chọn -c, quá trình tải xuống bắt đầu từ cùng một điểm mà nó đã dừng lại. Lưu ý rằng tùy chọn này cũng hoạt động khi bạn muốn hoàn tất quá trình tải xuống được bắt đầu bởi một chương trình khác ngoài wget.
3. Cách tải xuống tệp có tên tệp khác
Theo mặc định, wget lưu tệp có cùng tên mà nó mang trên Web. Nhưng nếu muốn, bạn cũng có thể lưu tệp đã tải xuống với tên tệp khác. Tính năng này có thể được truy cập bằng tùy chọn dòng lệnh -O (viết hoa).
Mã:
$ wget [B]-O[/b] [file-name] [URL]
4. Cách chuyển hướng đầu ra wget của bạn sang tệp nhật ký
Nếu muốn, bạn cũng có thể chuyển hướng các thông báo/thông tin mà wget tạo ra trên stdout sang tệp nhật ký. Bạn có thể thực hiện thao tác này bằng tùy chọn dòng lệnh -o (viết thường).
Mã:
$ wget [B]-o[/b] [log-filename] [URL]
Như bạn có thể thấy trong ảnh chụp màn hình ở trên, không có đầu ra hoặc thông báo nào được hiển thị trên đầu ra chuẩn. Nguyên nhân là do tất cả các thông báo đang được chuyển hướng đến tệp nhật ký có tên là ‘abc.log’.
Bạn có thể xem tệp nhật ký bằng lệnh cat.
Mã:
$ cat abc.log
5. Cách làm cho wget tải xuống các tệp ở chế độ nền
Sử dụng công cụ này, bạn có thể tải xuống các tệp ở chế độ nền. Tệp đã tải xuống sẽ được lưu với tên là ‘wget-log.’ Tính năng này có thể được truy cập bằng tùy chọn dòng lệnh -b.
Mã:
$ wget -b [URL]
Lưu ý rằng bạn có thể thay đổi tên tệp bằng cách sử dụng tùy chọn -o (chữ thường) mà chúng tôi đã giải thích trước đó.
6. Cách giới hạn tốc độ tải xuống khi sử dụng wget
Khi sử dụng wget, bạn cũng có thể giới hạn tốc độ tải xuống. Điều này có thể được thực hiện bằng tùy chọn -limit-rate, tùy chọn này yêu cầu một giá trị biểu thị số lượng theo byte mỗi giây. Số lượng có thể tính bằng byte, kilobyte với hậu tố 'k' hoặc megabyte với hậu tố 'm'.
Mã:
$ wget [B]–limit-rate=[amount][/b] [URL]
7. Cách thay đổi thời gian chờ đọc wget
Thời gian chờ đọc là khoảng thời gian (tính bằng giây) mà wget kiểm tra dữ liệu (trong trường hợp không nhận được dữ liệu) trước khi bắt đầu lại quá trình tải xuống. Theo mặc định, thời gian chờ đọc là 900 giây nhưng bạn có thể thay đổi bằng cách sử dụng tùy chọn –read-timeout.
Mã:
$ wget [B]–read-timeout=[thời gian tính bằng giây][/b] [URL]
8. Cách thay đổi số lần thử lại
Bất cứ khi nào quá trình tải xuống của bạn bị gián đoạn do kết nối internet kém hoặc bất kỳ lỗi nào khác, công cụ sẽ tự động tiếp tục quá trình tải xuống. Theo mặc định, tiện ích sẽ thử 20 lần rồi dừng lại. Nhưng nếu bạn muốn tăng hoặc giảm số lần thử, bạn có thể thực hiện bằng cách sử dụng tùy chọn dòng lệnh -t.
Mã:
$ wget [B]-t[/b] [số lần thử lại bạn muốn] [URL]
Như bạn có thể thấy trong ảnh chụp màn hình ở trên, wget đã bỏ cuộc sau hai lần thử.
LƯU Ý: Tính năng này đi kèm với ngoại lệ của các lỗi nghiêm trọng như "connection denied" hoặc "not found" (404), không được thử lại.
9. Cách làm cho wget hiển thị thông tin gỡ lỗi
Nếu muốn, bạn cũng có thể làm cho lệnh wget hiển thị thông tin bổ sung liên quan đến quá trình tải xuống. Thông tin này hữu ích cho mục đích gỡ lỗi nếu công cụ không hoạt động bình thường. Có thể truy cập tính năng này bằng tùy chọn dòng lệnh --debug hoặc -d.
Mã:
$ wget [B]–debug[/b] [URL]
10. Cách sửa đổi đồng hồ đo tiến trình tải xuống của wget
Nếu muốn, bạn cũng có thể sửa đổi chỉ báo tiến trình tải xuống mà wget hiển thị trong đầu ra. Có hai loại chỉ báo tiến trình: thanh (mặc định) và dấu chấm. Tuy nhiên, nếu đầu ra không được hiển thị trên thiết bị đầu cuối (TTY) thì chỉ báo dấu chấm được sử dụng làm mặc định.Tùy chọn --progress cho phép bạn chọn loại chỉ báo trong trường hợp bạn muốn ghi đè hành vi mặc định. Ví dụ:
Mã:
$ wget [B]--progress=dot[/b] [URL]
Tiếp theo, tùy thuộc vào kích thước tệp bạn đang tải xuống, bạn cũng có thể điều chỉnh cách hiển thị đồng hồ đo tiến trình tải xuống.
$ wget -–progress=[type]:[parameter]
'type' có thể là bar hoặc dot trong khi 'parameter' có thể là default, binary, mega hoặc giga.
Ví dụ: nếu bạn muốn đặt 'type' của mình là dot và 'parameter' là binary, thì bạn có thể sử dụng lệnh sau lệnh:
$ wget -–progress=dot:binary Đây là một ví dụ: Lưu ý rằng t...tm_source=diendancongnghe.com]trang hướng dẫn của lệnh.