Bạn có thể thiết lập Google Cloud Search để trả về kết quả từ nội dung tại cơ sở SharePoint của tổ chức, ngoài nội dung trên Google Workspace. Bạn sử dụng trình kết nối Google Cloud Search SharePoint On-Prem và định cấu hình trình kết nối để truy cập vào một nguồn dữ liệu SharePoint cụ thể.
Điểm quan trọng cần lưu ý
Chế độ cài đặt SharePoint danh dự
Trình kết nối Cloud Search SharePoint On-Prem luôn tuân thủ chế độ cài đặt Chế độ hiển thị tìm kiếm trên SharePoint. Bạn không thể ghi đè chế độ này. Đối với tài liệu nháp, các quyền trên tài khoản người dùng (mà trình kết nối sử dụng để truy cập SharePoint Online) sẽ kiểm soát những tài liệu nháp được lập chỉ mục và trả về. Nếu tài khoản chỉ có quyền "Đọc đầy đủ", trình kết nối sẽ áp dụng chế độ cài đặt "Chế độ hiển thị mục nháp" trên SharePoint.
Bạn cũng có thể định cấu hình trình kết nối để giới hạn kết quả dựa trên quyền truy cập vào tài khoản của người dùng. Bạn có thể sử dụng các đối tượng chính và đối tượng chính bên ngoài của Google để xác định ACL. Để áp dụng tính năng cắt giảm bảo mật cho nội dung SharePoint, hãy đồng bộ hoá các danh tính bên ngoài sau đây với Google Directory:
- Người dùng Active Directory
- Nhóm Active Directory
- Nhóm địa phương trên SharePoint (với nhóm và người dùng Active Directory là thành viên)
Để đồng bộ hóa nhóm và người dùng AD, bạn hãy sử dụng Google Cloud Directory Sync, cho phép các nhóm được ánh xạ danh tính. Để đồng bộ hoá các nhóm cục bộ SharePoint, bạn hãy sử dụng SharePoint Identity Connector.
Trình kết nối cũng cần tiến hành tra cứu bằng AD để tìm nạp thêm thông tin nhằm đồng bộ hoá các đối tượng chính. Ví dụ: việc tra cứu bằng AD cho phép trình kết nối thực hiện những việc sau:
- Liên kết SID cho một nhóm miền với sAMAccountName tương ứng.
- Liên kết sAMAccountName của người dùng với địa chỉ email dành cho gói thành viên của nhóm địa phương trên SharePoint.
Tối ưu hoá chiến dịch Tìm kiếm
Bạn có thể cải thiện trải nghiệm của người dùng bằng cách định cấu hình trình kết nối để trả về các kết quả tìm kiếm phù hợp hơn.
Để sử dụng API này, hãy đặt giá trị cho tham số tạo HTML trong tệp cấu hình trình kết nối SharePoint Online. Các thông số này cho phép bạn đặt những trường có tác động cao hoặc thấp hơn đến kết quả trùng khớp.
Để thiết lập một giản đồ, hãy làm theo hướng dẫn trong bài viết Tạo và đăng ký giản đồ. Khi bạn thiết lập một giản đồ:
Để ánh xạ tên của loại nội dung SharePoint với định nghĩa đối tượng tương ứng, trình kết nối chuẩn hoá tên loại nội dung bằng cách loại trừ các ký tự không được hỗ trợ. Đối với định nghĩa đối tượng, Cloud Search API chỉ hỗ trợ A-Z, a-z và 0-9 dưới dạng các ký tự hợp lệ. Ví dụ: loại nội dung "Thông báo" liên kết với định nghĩa đối tượng "Thông báo". Loại nội dung "News Article" liên kết với "Bài viết" (không có dấu cách).
Khi trình kết nối không thể khớp định nghĩa đối tượng với định nghĩa đối tượng, trình kết nối sẽ sử dụng loại đối tượng dự phòng (
itemMetadata.objectType
). Tìm hiểu thêm về thông số cấu hình siêu dữ liệu.Để ánh xạ tên thuộc tính SharePoint đến định nghĩa thuộc tính, trình kết nối chuẩn hoá tên thuộc tính bằng cách giải mã các ký tự được mã hoá theo hệ thập lục phân và xoá tiền tố "ows_", sau đó loại trừ các ký tự không được hỗ trợ (tất cả các ký tự ngoại trừ A-Z, a-z và 0-9 là ký tự hợp lệ).
Xử lý thư từ Microsoft Outlook
Khi trình kết nối gặp các tệp .msg của Microsoft Outlook khi lập chỉ mục nội dung, trình kết nối sẽ ghi đè loại phương tiện cho các tệp và lập chỉ mục chúng dưới dạng application/vnd.ms-outlook.
Cấu hình nhiều khách hàng
Nếu SharePoint là dịch vụ triển khai nhiều khách hàng, nơi nhiều trang web của khách hàng được lưu trữ trên cùng một ứng dụng web, bạn cần định cấu hình chế độ thu thập trang web trong tệp cấu hình. Trong quá trình triển khai nhiều khách hàng, bạn chỉ nhận được quyền cho bộ sưu tập trang web của mình và không thể nhận quyền Đọc đầy đủ, theo yêu cầu của trình kết nối SharePoint On-Prem.
Cách bật chế độ thu thập trang web:
- Cấp quyền quản trị viên thu thập trang web cho tài khoản người dùng của trình kết nối.
- Đặt
sharepoint.server
trong tệp cấu hình trình kết nối của bạn thành URL thu thập trang web, chẳng hạn nhưhttp://sharepoint.example.com/sites/sitecollection
. URL không cần sử dụng cùng một trường hợp như trên SharePoint. - Đặt
sharepoint.siteCollectionOnly
trong tệp cấu hình trình kết nối của bạn thànhtrue
.
Nếu bạn có nhiều bộ sưu tập trang web cần lập chỉ mục trong môi trường nhiều khách hàng, bạn cần phải định cấu hình một bản sao trình kết nối cho mỗi bộ sưu tập trang web.
Các giới hạn đã biết của trình kết nối
- Thời gian cần thiết để trình kết nối phát hiện các thay đổi đối với các mục trong cơ sở dữ liệu sẽ tăng theo số lượng cơ sở dữ liệu mà trình kết nối theo dõi.
- Mức sử dụng bộ nhớ sẽ tăng lên theo số lượng người dùng và nhóm riêng biệt mà bạn sử dụng trong các tệp Danh sách kiểm soát quyền truy cập (ACL) cho mỗi tập hợp trang web.
- Bạn có thể định cấu hình trình kết nối với các danh tính chỉ từ một Miền Active Directory.
- Một số phần tử chính phổ biến của Active Directory và Windows, chẳng hạn như
Everyone
,BUILTIN\Users
vàAll Authenticated Users
, không được hỗ trợ. - Quá trình xoá thông báo không diễn ra ngay lập tức và có thể mất hơn 4 giờ để trình kết nối nhận ra rằng người dùng đã xoá nội dung khỏi kho lưu trữ nguồn.
Yêu cầu về hệ thống
Yêu cầu về hệ thống | |
---|---|
Hệ điều hành |
|
Phần mềm |
|
Xác thực |
|
Triển khai trình kết nối
Điều kiện tiên quyết
Tạo một khoá riêng tư của Google Workspace. Khoá này chứa mã tài khoản dịch vụ của bạn. Để tìm hiểu cách lấy khoá riêng tư, hãy chuyển đến phần Thiết lập quyền truy cập vào Google Cloud Search API.
Quản trị viên Google Workspace của bạn phải thêm nguồn dữ liệu để tìm kiếm. Ghi lại mã nguồn dữ liệu.
Nếu trình kết nối trả về kết quả dựa trên ACL (kết quả không công khai), thì quản trị viên Google Workspace của bạn phải tạo hai nguồn nhận dạng và cung cấp cho bạn mã nhận dạng của các nguồn đó:
- Nguồn nhận dạng để đồng bộ hoá người dùng và nhóm Active Directory.
- Nguồn nhận dạng cho các nhóm SharePoint Local
Quản trị viên cũng phải lấy mã khách hàng Google Workspace của tổ chức bạn và cung cấp cho bạn.
Tìm hiểu cách nhận các giá trị này trong bài viết Liên kết danh tính người dùng trong Cloud Search.
Thiết lập tài khoản người dùng cho trình kết nối có quyền Đọc đầy đủ đối với Ứng dụng web SharePoint trong chính sách người dùng.
Nếu Ứng dụng web SharePoint không có bộ sưu tập trang web gốc, hãy tạo một bộ sưu tập.
Nếu có bất kỳ tập hợp trang web nào bị khoá tính năng ghi, hãy đăng nhập vào máy chủ SharePoint bằng tài khoản có đặc quyền của Quản trị viên rồi chạy tập lệnh
PrepareWriteLockedSites.ps1
.Để lấy các chỉ số về nguồn dữ liệu nhằm cung cấp thông tin cho cấu hình trình kết nối của bạn, hãy đăng nhập vào máy chủ SharePoint bằng tài khoản có đặc quyền quản trị trang trại và chạy
diagnose_sp.ps1
.Kết quả đầu ra báo cáo số lượng ứng dụng web, tài liệu và tư cách thành viên trong nhóm người dùng. Hãy sử dụng thông tin này để ước tính số lượng bản sao trình kết nối mà bạn cần, yêu cầu về bộ nhớ và số lượng tài liệu.
Bước 1. Cài đặt phần mềm trình kết nối SharePoint On-Prem của Google Cloud Search.
Sao chép kho lưu trữ trình kết nối trên GitHub.
$ git clone https://github.com/google-cloudsearch/sharepoint-connector.git $ cd sharepoint-connector
Kiểm tra phiên bản mong muốn của trình kết nối:
$ git checkout tags/latest_version
Trong đó:
latest_version
= một giá trị, chẳng hạn nhưv1-0.0.5
Xây dựng trình kết nối.
$ mvn package
Để bỏ qua quá trình kiểm thử khi bạn tạo trình kết nối, hãy chạy
mvn package -DskipTests
thay vìmvn package
.Sao chép tệp zip của trình kết nối vào thư mục cài đặt cục bộ của bạn:
$ cp target/google-cloudsearch-sharepoint-connector-latest_version.zip installation-dir $ cd installation-dir $ unzip google-cloudsearch-sharepoint-connector-latest_version.zip $ cd google-cloudsearch-sharepoint-connector-latest_version
Bước 2. Tạo tệp cấu hình trình kết nối SharePoint On-Prem
Trong cùng thư mục với quá trình cài đặt trình kết nối, hãy tạo một tệp. Bạn nên đặt tên tệp là
connector-config.properties
để không cần thêm tham số dòng lệnh để chạy trình kết nối. Nếu bạn định chạy nhiều phiên bản trình kết nối, hãy thêm chi tiết vào tên để phân biệt.Thêm thông số dưới dạng cặp khoá/giá trị vào nội dung tệp, như trong ví dụ sau:
### Sharepoint On-Prem Connector configuration ### # Required parameters for data source access api.sourceId=08ef8becd116faa4546b8ca2c84b2879 api.serviceAccountPrivateKeyFile=service_account.json api.identitySourceId=08ef8becd116faa475de26d9b291fed9 # Required parameters for SharePoint on-premises access sharepoint.server=http://sp-2016:32967/sites/doc-center-site-collection sharepoint.siteCollectionOnly=true sharepoint.username=contoso\\admin sharepoint.password=pa$sw0rd sharepoint.stripDomainInUserPrincipals=true # Required parameters for AD lookup adLookup.host=dc.contoso.com adLookup.username=contoso\\admin adLookup.password=pa$sw0rd api.referenceIdentitySources=CONTOSO,contoso api.referenceIdentitySource.contoso.id=08ef8becd116faa5d3783f8c5a80e5aa api.referenceIdentitySource.CONTOSO.id=08ef8becd116faa5d3783f8c5a80e5aa # Optional parameters for schema mapping contentTemplate.sharepointItem.title=Title contentTemplate.sharepointItem.unmappedColumnsMode=APPEND
Để biết nội dung mô tả chi tiết về từng thông số, hãy xem tài liệu tham khảo về thông số cấu hình.
(Không bắt buộc) Định cấu hình các thông số bổ sung của trình kết nối, nếu cần. Để biết thông tin chi tiết, hãy chuyển đến bài viết Tham số trình kết nối do Google cung cấp.
Bước 3. Đối với HTTPS, hãy thêm SharePoint làm máy chủ đáng tin cậy
Nếu SharePoint được định cấu hình để sử dụng HTTPS, hãy lấy chứng chỉ SharePoint để thêm làm máy chủ lưu trữ đáng tin cậy cho trình kết nối.
Trên máy tính sẽ chạy trình kết nối, hãy mở trình duyệt rồi truy cập vào SharePoint.
Trên trang cảnh báo mới mở ra, hãy nhấp vào I HIỂU Risks (Tôi hiểu rõ rủi ro) rồi Add Exception (Thêm trường hợp ngoại lệ). Trang này hiển thị thông báo như "Kết nối này không đáng tin cậy" vì chứng chỉ là tự ký và chưa do Tổ chức phát hành chứng chỉ đáng tin cậy ký.
Khi nút Xem đã có, hãy nhấp vào nút đó.
Chuyển tới thẻ Chi tiết rồi nhấp vào Xuất.
Lưu chứng chỉ vào thư mục trình kết nối với tên
sharepoint.crt
.Nhấp vào Đóng rồi nhấp vào Huỷ để đóng cửa sổ.
Mở lời nhắc lệnh và nhập lệnh sau:
$ keytool -importcert -keystore cacerts.jks -storepass changeit -file sharepoint.crt -alias sharepoint
Khi được nhắc "Tin tưởng chứng chỉ này?", hãy trả lời có.
Bước 4. Thiết lập tính năng ghi nhật ký
Trong thư mục chứa tệp nhị phân của trình kết nối, hãy tạo một thư mục có tên là
logs
.Trong cùng thư mục đó (không phải
logs
), hãy tạo một tệp mã hoá Latinh1 có tên làlogging.properties
.Thêm văn bản sau vào
logging.properties
:handlers = java.util.logging.ConsoleHandler,java.util.logging.FileHandler # Default log level .level = INFO # uncomment line below to increase logging level for SharePoint APIsa #com.google.enterprise.cloudsearch.sharepoint.level=FINE # uncomment line below to increase logging level to enable API trace #com.google.api.client.http.level = FINE java.util.logging.ConsoleHandler.level = INFO java.util.logging.FileHandler.pattern=logs/connector-sharepoint.%g.log java.util.logging.FileHandler.limit=10485760 java.util.logging.FileHandler.count=10 java.util.logging.FileHandler.formatter=java.util.logging.SimpleFormatter
Bước 5. Định cấu hình trình kết nối danh tính SharePoint On-Prem
Đây là bước bắt buộc để áp dụng các ACL dựa trên danh tính của SharePoint On-Prem cho kết quả tìm kiếm. Nếu bạn thiết lập trình kết nối với các ACL công khai, bạn có thể bỏ qua bước này.
Trong cùng thư mục với phần cài đặt trình kết nối SharePoint Online, hãy tạo một tệp và đặt tên tệp là
sharepoint-onprem-identity-connector.config
.Thêm thông số dưới dạng cặp khoá/giá trị vào nội dung tệp, như trong ví dụ sau:
### SharePoint On-prem identity connector configuration ### # Required parameters for data source access api.customerId=C05d3djk8 api.serviceAccountPrivateKeyFile=service_account.json api.identitySourceId=08ef8becd116faa475de26d9b291fed9 # Required parameters for SharePoint access sharepoint.server=http://sp-2016:32967/sites/doc-center-site-collection sharepoint.siteCollectionOnly=true sharepoint.username=contoso\\admin sharepoint.password=pa$sw0rd sharepoint.stripDomainInUserPrincipals=true # Required parameters for AD lookup adLookup.host=dc.contoso.com adLookup.username=contoso\\admin adLookup.password=pa$sw0rd api.referenceIdentitySources=CONTOSO,contoso api.referenceIdentitySource.contoso.id=08ef8becd116faa5d3783f8c5a80e5aa api.referenceIdentitySource.CONTOSO.id=08ef8becd116faa5d3783f8c5a80e5aa
Các giá trị gần giống với trình kết nối SharePoint On-Prem, ngoại trừ việc tham số là
api.customerId
thay vìapi.sourceId
. Giá trị củaapi.customerId
là mã khách hàng mà bạn nhận được từ quản trị viên Google Workspace.
Bước 6. Khởi chạy trình kết nối SharePoint On-Prem
Trong các bước sau, bạn liên kết dữ liệu chính trong cả Active Directory tại cơ sở và tập hợp trang web SharePoint với các danh tính trong dịch vụ Cloud Identity. Quá trình đồng bộ hoá này được thực hiện bằng Google Cloud Directory Sync (GCDS) và trình kết nối danh tính SharePoint On-Prem.
Sau khi GCDS đồng bộ hoá người dùng và nhóm, để đồng bộ hoá các nhóm thu thập trang web SharePoint, hãy chạy trình kết nối danh tính SharePoint On-Prem. Cuối cùng, hãy chạy trình kết nối SharePoing On-Prem để lập chỉ mục và phân phát kết quả cho người dùng Cloud Search của bạn.
Nếu bạn chưa thực hiện, hãy định cấu hình và chạy GCDS. Hãy nhớ bật nhóm được ánh xạ danh tính.
Chạy trình kết nối danh tính SharePoint On-Prem:
$ java -Djava.util.logging.config.file=logging.properties -cp "google-cloudsearch-sharepoint-connector-version.jar" com.google.enterprise.cloudsearch.sharepoint.SharePointIdentityConnector -Dconfig=sharepoint-onprem-identity-connector.config
Chạy trình kết nối SharePoint On-Prem. Sử dụng cú pháp lệnh cho tính năng bảo mật trang web SharePoint của bạn:
HTTP (không cần máy chủ đáng tin cậy):
$ java -Djava.util.logging.config.file=logging.properties -jar google-cloudsearch-sharepoint-connector-v1-version.jar
HTTPS (thêm SharePoint làm máy chủ đáng tin cậy):
$ java -Djavax.net.ssl.trustStore=cacerts.jks -Djavax.net.ssl.trustStoreType=jks -Djavax.net.ssl.trustStorePassword=changeit -Djava.util.logging.config.file=logging.properties -jar google-cloudsearch-sharepoint-connector-v1-version.jar
Tài liệu tham khảo về thông số cấu hình
Truy cập nguồn dữ liệu
Xem xét | Thông số |
Mã nguồn dữ liệu | api.sourceId=1234567890abcdef
Bắt buộc. Mã nguồn dữ liệu Google Cloud Search do quản trị viên Google Workspace thiết lập. |
Đường dẫn đến tệp khoá riêng tư của tài khoản dịch vụ | api.serviceAccountPrivateKeyFile=PrivateKey.json
Bắt buộc. Đường dẫn đến tệp khoá tài khoản dịch vụ Google Cloud Search. |
Quyền truy cập vào SharePoint tại chỗ
Xem xét | Thông số |
URL máy chủ SharePoint | sharepoint.server=http://yoursharepoint.example.com/
Bắt buộc. URL của máy chủ SharePoint dưới dạng tên máy chủ lưu trữ đủ điều kiện, chẳng hạn như http://yoursharepoint.example.com/. Nếu tên máy chủ không đủ điều kiện, bạn phải đặt chế độ ghi đè DNS trên máy chủ lưu trữ trình kết nối. |
Tên người dùng SharePoint | sharepoint.username=YOURDOMAIN\\ConnectorUser
Đây là thông tin bắt buộc khi bạn chạy trình kết nối trên Linux hoặc trên máy tính Windows không thuộc miền Quảng cáo máy chủ SharePoint. |
Mật khẩu SharePoint | sharepoint.password=user_password
Đây là thông tin bắt buộc khi bạn chạy trình kết nối trên Linux hoặc trên máy tính Windows không thuộc miền Quảng cáo máy chủ SharePoint. |
Sử dụng Xác thực trực tiếp để kết nối với SharePoint | sharepoint.username=AdaptorUser Live Authentication Id
|
Sử dụng tính năng Xác thực ADFS để kết nối với SharePoint | sharepoint.username=AdaptorUser@yourdomain.com
|
Lập chỉ mục tập hợp trang web
Xem xét | Thông số |
Loại chỉ mục | sharepoint.siteCollectionOnly=boolean
Không bắt buộc, ngoại trừ việc triển khai SharePoint nhiều khách hàng (tìm hiểu thêm). Đặt thành đúng để có chỉ mục trình kết nối |
Liên kết danh tính trong SharePoint
Xem xét | Thông số |
ID nguồn nhận dạng | api.identitySourceId=1234567890abcdef
Bắt buộc. Mã nguồn nhận dạng để đồng bộ hoá SharePoint Local Groups.Mã nguồn Google Cloud Search do quản trị viên Google Workspace thiết lập, theo mô tả trong phần Thêm nguồn dữ liệu vào hoạt động tìm kiếm. |
Nguồn nhận dạng tệp đối chiếu | api.referenceIdentitySources=CONTOSO,contoso
Danh sách các nguồn nhận dạng tham chiếu được phân tách bằng dấu phẩy cho các đối tượng chính của thư mục đang hoạt động. Giá trị này khớp với tên Active Directory NETBIOS của các tên chính trong thư mục đang hoạt động tham chiếu. |
Mã nguồn nhận dạng tệp đối chiếu | api.referenceIdentitySource.DOMAIN.id=identity-source-id
Bắt buộc. Mã nhận dạng nguồn nhận dạng để đồng bộ hoá các đối tượng chính của Active Directory. |
Tra cứu Active Directory
Xem xét | Thông số |
Máy chủ Active Directory | adLookup.host=host
Bắt buộc. Tên máy chủ của thư mục đang hoạt động, chẳng hạn như dc.contoso.com hoặc địa chỉ IP. |
Cổng tra cứu Active Directory | adLookup.port=port
Không bắt buộc. Giá trị mặc định là 389. Sử dụng 686 cho SSL. |
Phương pháp tra cứu Active Directory | adLookup.method=value
Không bắt buộc. Giá trị mặc định là "tiêu chuẩn". Đối với kết nối HTTPS, hãy đặt thành "SSL". |
Người dùng tra cứu Active Directory | adLookup.username=CONTOSO\user1
Bắt buộc. Người dùng được phép thực hiện tra cứu thư mục đang hoạt động. |
Mật khẩu tra cứu Active Directory | adLookup.password=password123
Bắt buộc. Mật khẩu cho người dùng do |
Tạo nội dung HTML
Xem xét | Thông số |
Trường tiêu đề mẫu HTML | contentTemplate.sharePointItem.title=Title
Trường SharePoint để sử dụng làm tiêu đề mẫu HTML cho HTML được tạo. |
Trường chất lượng tìm kiếm cao của nội dung HTML | contentTemplate.sharePointItem.quality.high=highField1[,highField2,...]
Danh sách các trường được phân tách bằng dấu phẩy để đưa vào HTML được tạo dưới dạng các trường chất lượng cao. Khi cụm từ tìm kiếm khớp với những trường này, kết quả sẽ được xếp hạng cao hơn. |
Trường chất lượng tìm kiếm trung bình của nội dung HTML | contentTemplate.sharePointItem.quality.medium=mediumField1[,mediumField2,...]
Danh sách các trường được phân tách bằng dấu phẩy để đưa vào HTML được tạo dưới dạng các trường chất lượng trung bình. |
Trường có chất lượng tìm kiếm thấp của nội dung HTML | contentTemplate.sharePointItem.quality.low=lowField1[,lowField2,...]
Danh sách các trường được phân tách bằng dấu phẩy để đưa vào HTML được tạo dưới dạng các trường chất lượng thấp. |
Các cột chưa được liên kết của nội dung HTML | contentTemplate.sharepointItem.unmappedColumnsMode=APPEND
Cách trình kết nối xử lý các cột chưa được liên kết. Giá trị là APPEND (mặc định) hoặc BỎ QUA.
|