您可以设置 Google Cloud Search,使其除了返回 Google Workspace 内容之外,还返回组织 SharePoint 本地内容的结果。 使用 Cloud Search SharePoint 本地连接器,并将其配置为访问特定的 SharePoint 数据源。
重要注意事项
在部署 SharePoint 本地连接器之前,请注意以下事项。
遵循的 SharePoint 设置
连接器始终遵循 SharePoint 上的搜索可见性 设置。对于草稿文档,连接器用于访问 SharePoint 的用户账号的权限控制着连接器编入索引和返回的文档。如果该账号具有“完全读取”权限,则连接器会遵循“草稿项可见性”设置。
您还可以使用 Google 主账号和外部主账号定义 ACL,根据用户账号访问权限限制结果。如需应用安全调整,请将这些外部身份与 Google Cloud Directory 同步:
- Active Directory 用户和群组。
- SharePoint 本地群组(成员包括 Active Directory 用户和群组)。
如需同步 AD 用户和群组,请使用 Google Cloud Directory Sync 并启用身份映射的 群组。对于 SharePoint 本地群组,请使用 SharePoint 身份连接器。
连接器还会执行 Active Directory 查找,以提取用于同步主账号的信息,例如将 SID 映射到 sAMAccountName。
搜索优化
通过配置连接器以返回相关结果,改进搜索体验。在配置文件中使用 HTML 生成参数来设置字段影响级别。
如需设置架构,请参阅 创建和注册架构。 设置架构时:
- 连接器会将 SharePoint 内容类型标准化为有效的对象定义名称(A-Z、a-z、0-9)。例如,“News Article”会变为“NewsArticle”。
- 如果连接器无法匹配对象定义,则会使用后备
对象类型 (
itemMetadata.objectType)。请参阅 元数据配置参数。 - 连接器通过解码十六进制字符并移除“ows_”前缀,使属性名称标准化。
Microsoft Outlook 消息处理
连接器会替换 Microsoft Outlook .msg 文件的媒体类型,并以 application/vnd.ms-outlook 形式将此类文件编入索引。
多租户配置
对于多租户部署,请配置网站集模式:
- 为连接器账号授予网站集管理员 权限。
- 将
sharepoint.server设置为网站集网址(例如http://sharepoint.example.com/sites/collection)。 - 将
sharepoint.siteCollectionOnly设置为true。
为每个网站集配置一个连接器实例。
已知限制
- 更改的检测时间会随着受监控数据库数量的增加而延长。
- 内存用量会随着 ACL 中唯一身份用户和群组数量的增加而增加。
- 连接器仅支持来自一个 Active Directory 域的身份。
- 删除通知可能需要 4 个多小时才能生效。
系统要求
| 系统要求 | |
|---|---|
| 操作系统 | Windows Server 2016、Ubuntu、Red Hat Enterprise Linux 5.0 或 SUSE Enterprise Linux 10(64 位)。 |
| 软件 | SharePoint Server 2013 或 2016;Java JRE 1.8。 |
| 身份验证 | NTLM、Kerberos、HTTP Basic 或 ADFS。 |
部署连接器
按照以下步骤部署 SharePoint 本地连接器。
前提条件
- 创建 Google Workspace 私钥。请参阅 配置对 Cloud Search API 的访问权限。
- 添加可供搜索的数据源并记录其 ID。请参阅 添加可供搜索的数据源。
- 对于基于 ACL 的结果,您的管理员必须创建两个身份源(一个用于 Active Directory,另一个用于 SharePoint 本地群组),并提供 Google Workspace 客户 ID。请参阅 映射用户身份。
- 为连接器设置具有完全读取 权限的用户账号。
- 确保 SharePoint Web 应用具有根网站集。
- 如果网站集处于写入锁定状态,请运行
PrepareWriteLockedSites.ps1脚本。
第 1 步:安装连接器软件
- 克隆代码库:
$ git clone https://github.com/google-cloudsearch/sharepoint-connector.git $ cd sharepoint-connector
- 检出所选版本(例如
v1-0.0.5):$ git checkout tags/v1-0.0.5 - 构建连接器:
如需跳过测试,请使用$ mvn packagemvn package -DskipTests。 - 将 ZIP 文件解压缩到安装目录。
第 2 步:创建配置文件
在安装目录中创建 connector-config.properties。以键值对的形式添加参数:
api.sourceId=08ef8becd116faa4546b8ca2c84b2879
api.serviceAccountPrivateKeyFile=service_account.json
api.identitySourceId=08ef8becd116faa475de26d9b291fed9
sharepoint.server=http://sp-2016:32967/sites/collection
sharepoint.siteCollectionOnly=true
sharepoint.username=contoso\\admin
sharepoint.password=password
adLookup.host=dc.contoso.com
adLookup.username=contoso\\admin
adLookup.password=password
如需了解详情,请参阅参考文档或 Google 提供的参数 。
第 3 步:将 SharePoint 添加为可信主机 (HTTPS)
如果使用 HTTPS,请导出 SharePoint 证书并将其导入连接器的密钥库:
$ keytool -importcert -keystore cacerts.jks -storepass changeit -file sharepoint.crt -alias sharepoint第 4 步:设置日志记录
创建一个 logs 文件夹和一个 logging.properties 文件,其中包含以下内容:
properties
handlers = java.util.logging.ConsoleHandler,java.util.logging.FileHandler
.level = INFO
java.util.logging.ConsoleHandler.level = INFO
java.util.logging.FileHandler.pattern=logs/connector-sharepoint.%g.log
第 5 步:配置身份连接器
如需应用基于身份的 ACL,请使用您的 api.customerId 和其他连接参数创建 sharepoint-onprem-identity-connector.config。
第 6 步:启动连接器
- 运行 GCDS 以同步 Active Directory 用户和群组。
- 运行 SharePoint 身份连接器以同步网站集群组。
- 运行 SharePoint 本地连接器以将内容编入索引。
配置参数参考
以下部分列出了用于配置 SharePoint 本地连接器的配置参数。
数据源访问权限
| 设置 | 参数 |
| 数据源 ID | api.sourceId=ID |
| 服务账号 | api.serviceAccountPrivateKeyFile=path |
SharePoint 本地访问权限
| 设置 | 参数 |
| 服务器网址 | sharepoint.server=URL |
| 凭据 | sharepoint.username 和 sharepoint.password |
HTML 内容生成
| 设置 | 参数 |
| 标题字段 | contentTemplate.sharePointItem.title=Title |
| 质量字段 | contentTemplate.sharePointItem.quality.high、medium 或 low |