Apache Solr là gì? Apache Solrlà một nền tảng tìm kiếm cấp doanh nghiệp mã nguồn mở được viết bằng Java cho phép bạn tạo các công cụ tìm kiếm tùy chỉnh lập chỉ mục cơ sở dữ liệu, tệp và trang web. Nó có hỗ trợ phụ trợ cho Apache Lucene. Ví dụ, nó có thể được sử dụng để tìm kiếm trong nhiều trang web và có thể hiển thị các đề xuất cho nội dung được tìm kiếm. Solr sử dụng ngôn ngữ truy vấn và kết quả dựa trên XML (Ngôn ngữ đánh dấu mở rộng). Có các API (Giao diện chương trình ứng dụng) khả dụng cho Python, Ruby và JSON (Ký hiệu đối tượng Javascript).
Một số tính năng khác mà Solr cung cấp là:
Để cập nhật hệ thống của bạn, hãy thực hiện lệnh sau để cập nhật hệ thống của bạn bằng các bản vá và bản cập nhật mới nhất.
Chúng ta phải cài đặt Python Software properties để cài đặt Java 8 mới nhất. Chạy lệnh sau để cài đặt phần mềm.
Nhấn Y để tiếp tục.
Sau khi thực hiện lệnh, hãy thêm kho lưu trữ Java PPA của webupd8team vào hệ thống của bạn bằng cách chạy:
Nhấn [ENTER] khi được yêu cầu. Bây giờ, bạn có thể dễ dàng cài đặt phiên bản Java 8 mới nhất bằng apt.
Trước tiên, hãy cập nhật danh sách gói để lấy các gói có sẵn từ PPA mới:
Sau đó, hãy cài đặt phiên bản Oracle Java 8 mới nhất bằng lệnh này:
Nhấn Y để tiếp tục.
Bạn PHẢI đồng ý với giấy phép có sẵn tại http://java.com/license nếu bạn muốn sử dụng Oracle JDK, hãy nhấp vào nút OK.
Gói cài đặt một loại trình cài đặt siêu dữ liệu sau đó tải xuống các tệp nhị phân trực tiếp từ Oracle. Sau quá trình cài đặt, hãy kiểm tra phiên bản Java đã cài đặt bằng cách chạy lệnh sau
Bây giờ bạn đã cài đặt Java 8 và chúng ta sẽ chuyển sang bước tiếp theo.
Chúng ta sẽ bắt đầu bằng cách tải xuống bản phân phối Solr. Trước tiên, hãy tìm phiên bản mới nhất của gói có sẵn từ trang web của họ, sao chép liên kết và tải xuống bằng lệnh wget
Ví dụ, chúng ta sẽ sử dụng http://www.us.apache.org/dist/lucene/solr/5.5.0
Bây giờ, hãy chạy lệnh bên dưới để giải nén tệp cài đặt dịch vụ:
Và cài đặt Solr dưới dạng dịch vụ bằng cách sử dụng tập lệnh:
Đầu ra sẽ tương tự như sau:
Sử dụng lệnh này để kiểm tra trạng thái của dịch vụ
Bạn sẽ thấy đầu ra bắt đầu bằng:
Thư mục lõi mới cho bộ sưu tập đầu tiên của chúng tôi đã được tạo. Để xem tệp lược đồ mặc định, hãy truy cập:
'/opt/solr/server/solr/configsets/data_driven_schema_configs/conf' .
Ví dụ:
Để xem thông tin chi tiết về bộ sưu tập đầu tiên mà chúng ta đã tạo trước đó, hãy chọn bộ sưu tập "gettingstarted" trong menu bên trái.
Sau khi bạn đã chọn Bộ sưu tập "gettingstarted", hãy chọn Documentstrong menu bên trái. Tại đó, bạn có thể nhập dữ liệu thực tế ở định dạng JSON mà Solr có thể tìm kiếm được. Để thêm dữ liệu, hãy sao chép và dán ví dụ JSON sau vào trường Tài liệu:
Nhấp vào nút gửi tài liệu sau khi thêm dữ liệu.
Bây giờ chúng ta có thể nhấp vàoTruy vấnở bên trái, sau đónhấp vào Thực thi Truy vấn,
Chúng ta sẽ thấy nội dung tương tự như thế này:
Một số tính năng khác mà Solr cung cấp là:
- Tìm kiếm toàn văn.
- Tạo và tô sáng đoạn trích.
- Sắp xếp/xếp hạng tài liệu tùy chỉnh.
- Gợi ý chính tả.
Cập nhật Hệ thống của bạn
Sử dụng người dùng sudo không phải root để đăng nhập vào máy chủ Ubuntu của bạn. Thông qua người dùng này, bạn sẽ phải thực hiện tất cả các bước và sử dụng Solr sau.Để cập nhật hệ thống của bạn, hãy thực hiện lệnh sau để cập nhật hệ thống của bạn bằng các bản vá và bản cập nhật mới nhất.
Mã:
sudo apt-get update && apt-get upgrade -y
Thiết lập Java Runtime Environment
Solr là một ứng dụng Java, do đó, trước tiên cần cài đặt Java runtime environment để thiết lập Solr.Chúng ta phải cài đặt Python Software properties để cài đặt Java 8 mới nhất. Chạy lệnh sau để cài đặt phần mềm.
Mã:
sudo apt-get install python-software-properties
Mã:
Đang đọc danh sách gói... Xong
Đang xây dựng cây phụ thuộc
Đang đọc thông tin trạng thái... Xong
Các gói bổ sung sau sẽ được cài đặt:
python-pycurl
Các gói được đề xuất:
libcurl4-gnutls-dev python-pycurl-dbg
Các gói MỚI sau sẽ được cài đặt:
python-pycurl python-software-properties
0 đã nâng cấp, 2 mới cài đặt, 0 cần xóa và 7 chưa nâng cấp.
Cần lấy 67,5 kB tệp lưu trữ.
Sau thao tác này, 358 kB dung lượng đĩa bổ sung sẽ được sử dụng.
Bạn có muốn tiếp tục không? [Y/n]
Sau khi thực hiện lệnh, hãy thêm kho lưu trữ Java PPA của webupd8team vào hệ thống của bạn bằng cách chạy:
Mã:
sudo add-apt-repository ppa:webupd8team/java
Trước tiên, hãy cập nhật danh sách gói để lấy các gói có sẵn từ PPA mới:
Mã:
sudo apt-get update
Sau đó, hãy cài đặt phiên bản Oracle Java 8 mới nhất bằng lệnh này:
Mã:
sudo apt-get install oracle-java8-installer
Mã:
Đang đọc danh sách gói... Xong
Đang xây dựng cây phụ thuộc
..................................................
Sau thao tác này, 19,1 MB dung lượng đĩa bổ sung sẽ được sử dụng.
Bạn có muốn tiếp tục không? [Y/n]
Bạn PHẢI đồng ý với giấy phép có sẵn tại http://java.com/license nếu bạn muốn sử dụng Oracle JDK, hãy nhấp vào nút OK.
Gói cài đặt một loại trình cài đặt siêu dữ liệu sau đó tải xuống các tệp nhị phân trực tiếp từ Oracle. Sau quá trình cài đặt, hãy kiểm tra phiên bản Java đã cài đặt bằng cách chạy lệnh sau
Mã:
java -version
Mã:
java version "1.8.0_72"
Java(TM) SE Runtime Environment (bản dựng 1.8.0_72-b15)
Java HotSpot(TM) 64-Bit Server VM (bản dựng 25.72-b15, chế độ hỗn hợp)
Cài đặt ứng dụng Solr
Solr có thể được cài đặt trên Ubuntu theo nhiều cách khác nhau, trong bài viết này, tôi sẽ chỉ cho bạn cách cài đặt gói mới nhất từ nguồn.Chúng ta sẽ bắt đầu bằng cách tải xuống bản phân phối Solr. Trước tiên, hãy tìm phiên bản mới nhất của gói có sẵn từ trang web của họ, sao chép liên kết và tải xuống bằng lệnh wget
Ví dụ, chúng ta sẽ sử dụng http://www.us.apache.org/dist/lucene/solr/5.5.0
Mã:
cd /tmp
wgethttp://www.us.apache.org/dist/lucene/solr/5.5.0/solr-5.5.0.tgz
Mã:
wget http://www.us.apache.org/dist/lucene/solr/5.5.0/solr-5.5.0.tgz
--2016-02-26 22:21:37-- http://www.us.apache.org/dist/lucene/solr/5.5.0/solr-5.5.0.tgz
Đang giải quyết www.us.apache.org (www.us.apache.org)... 140.211.11.105
Đang kết nối tới www.us.apache.org (www.us.apache.org)|140.211.11.105|:80... đã kết nối.
Đã gửi yêu cầu HTTP, đang chờ phản hồi... 200 OK
Độ dài: 136758069 (130M) [application/x-gzip]
Đang lưu vào: ‘solr-5.5.0.tgz’
Mã:
tar xzf solr-5.5.0.tgz solr-5.5.0/bin/install_solr_service.sh --strip-components=2
Mã:
sudo ./install_solr_service.sh solr-5.5.0.tgz
Mã:
sudo ./install_solr_service.sh solr-5.5.0.tgz
id: solr: no such user
Đang tạo người dùng mới: solr
Đang thêm người dùng hệ thống `solr' (UID 114) ...
Đang thêm nhóm mới `solr' (GID 123) ...
Thêm người dùng mới `solr' (UID 114) với nhóm `solr' ...
Tạo thư mục home `/var/solr' ...
Giải nén solr-5.5.0.tgz vào /opt
Cài đặt liên kết tượng trưng /opt/solr -> /opt/solr-5.5.0 ...
Cài đặt tập lệnh /etc/init.d/solr ...
Cài đặt /etc/default/solr.in.sh ...
Thêm khởi động hệ thống cho /etc/init.d/solr ...
/etc/rc0.d/K20solr -> ../init.d/solr
/etc/rc1.d/K20solr -> ../init.d/solr
/etc/rc6.d/K20solr -> ../init.d/solr
/etc/rc2.d/S20solr -> ../init.d/solr
/etc/rc3.d/S20solr -> ../init.d/solr
/etc/rc4.d/S20solr -> ../init.d/solr
/etc/rc5.d/S20solr -> ../init.d/solr
Đợi tới 30 giây để xem Solr chạy trên cổng 8983 [-]
Đã khởi động máy chủ Solr trên cổng 8983 (pid=3288). Chúc bạn tìm kiếm vui vẻ!
Đã tìm thấy 1 nút Solr:
Quy trình Solr 3288 đang chạy trên cổng 8983
{
"solr_home":"/var/solr/data",
"version":"5.5.0 2a228b3920a07f930f7afb6a42d0d20e184a943c - mike - 2016-02-16 15:22:52",
"startTime":"2016-02-26T17:02:13.127Z",
"uptime":"0 ngày, 0 giờ, 0 phút, 17 giây",
"memory":"58,6 MB (%11,9) trong tổng số 490,7 MB"}
Dịch vụ solr đã cài đặt.
Mã:
trạng thái dịch vụ solr
Mã:
Tìm thấy 1 nút Solr:
Quy trình Solr 3288 đang chạy trên cổng 8983
{
"solr_home":"/var/solr/data",
"version":"5.5.0 2a228b3920a07f930f7afb6a42d0d20e184a943c - mike - 2016-02-16 15:22:52",
"startTime":"2016-02-26T17:02:13.127Z",
"uptime":"0 ngày, 0 giờ, 1 phút, 32 giây",
"memory":"61,4 MB (%12,5) trong tổng số 490,7 MB"}
Tạo bộ sưu tập tìm kiếm Solr:
Khi sử dụng Solr, chúng ta có thể tạo nhiều bộ sưu tập. Chạy lệnh đã cho, đề cập đến tên của bộ sưu tập (ở đây là gettingstarted) và chỉ định cấu hình của nó.
Mã:
sudo su - solr -c "/opt/solr/bin/solr create -c gettingstarted -n data_driven_schema_configs"
Mã:
Đang sao chép cấu hình vào thư mục phiên bản lõi mới:
/var/solr/data/gettingstarted
Đang tạo lõi mới 'gettingstarted' bằng lệnh:
http://localhost:8983/solr/admin/cores?action=CREATE&name=gettingstarted&instanceDir=gettingstarted
{
"responseHeader":{
"status":0,
"QTime":5268},
"core":"gettingstarted"}
'/opt/solr/server/solr/configsets/data_driven_schema_configs/conf' .
Sử dụng Giao diện web Solr
Apache Solr hiện có thể truy cập được trên cổng mặc định là 8983. Giao diện người dùng quản trị có thể truy cập được tại http://your_server_ip:8983/solr.Tường lửa của bạn phải cho phép cổng này chạy các liên kết.Ví dụ:
Mã:
http://192.168.1.105:8983/solr/
Để xem thông tin chi tiết về bộ sưu tập đầu tiên mà chúng ta đã tạo trước đó, hãy chọn bộ sưu tập "gettingstarted" trong menu bên trái.
Sau khi bạn đã chọn Bộ sưu tập "gettingstarted", hãy chọn Documentstrong menu bên trái. Tại đó, bạn có thể nhập dữ liệu thực tế ở định dạng JSON mà Solr có thể tìm kiếm được. Để thêm dữ liệu, hãy sao chép và dán ví dụ JSON sau vào trường Tài liệu:
Mã:
{
"id": 1,
"book_title": "Cuốn sách đầu tiên của tôi",
"published": 1985,
"description": "Tất cả về Linux"
}
Mã:
Trạng thái: thành công
Phản hồi:
{
"responseHeader": {
"status": 0,
"QTime": 606
}
}
Chúng ta sẽ thấy nội dung tương tự như thế này:
Mã:
Đầu ra truy vấn
{
"responseHeader": {
"status": 0,
"QTime": 66,
"params": {
"q": "*:*",
"indent": "true",
"wt": "json",
"_": "1456507717668"
}
},
"response": {
"numFound": 1,
"start": 0,
"docs": [
{
"id": "1",
"book_title": [
"Cuốn sách đầu tiên của tôi"
],
"published": [
1985
],
"description": [
"All about Linux"
],
"_version_": 1527258892658016300
}
]
}
}