Chất lượng tìm kiếm đề cập đến chất lượng của kết quả tìm kiếm về mặt thứ hạng và khả năng gợi nhắc theo cảm nhận của người dùng thực hiện cụm từ tìm kiếm.
Xếp hạng đề cập đến thứ tự của các mặt hàng và thu hồi đề cập đến số lượng mặt hàng có liên quan được truy xuất. Mục (còn gọi là tài liệu) là bất kỳ nội dung kỹ thuật số nào mà Google Cloud Search có thể lập chỉ mục. Các loại mục bao gồm tài liệu Microsoft Office, tệp PDF, một hàng trong cơ sở dữ liệu, URL duy nhất, v.v. Một mục bao gồm:
- Siêu dữ liệu có cấu trúc
- Nội dung có thể lập chỉ mục
- ACL
Cloud Search sử dụng nhiều tín hiệu để truy xuất và xếp hạng kết quả truy vấn tìm kiếm; các mục xuất hiện từ một truy vấn tìm kiếm. Bạn có thể tác động đến các tín hiệu của Cloud Search thông qua các chế độ cài đặt trong giản đồ, nội dung và siêu dữ liệu của mục (trong quá trình lập chỉ mục) cũng như ứng dụng tìm kiếm. Mục tiêu của tài liệu này là giúp bạn cải thiện chất lượng tìm kiếm bằng cách sửa đổi những yếu tố ảnh hưởng tín hiệu này.
Để biết thông tin tóm tắt về các chế độ cài đặt được đề xuất và không bắt buộc, hãy tham khảo bài viết Tóm tắt về các chế độ cài đặt chất lượng tìm kiếm được đề xuất và không bắt buộc.
Ảnh hưởng đến điểm số thời sự
Tính chủ đề đề cập đến mức độ liên quan của kết quả tìm kiếm với các cụm từ truy vấn ban đầu. Mức độ liên quan của một mục được tính toán dựa trên các tiêu chí sau:
- Tầm quan trọng của từng cụm từ truy vấn.
- Số lượt truy cập (số lần một cụm từ truy vấn xuất hiện trong nội dung hoặc siêu dữ liệu của mục).
- Loại của cụm từ truy vấn và các biến thể của cụm từ đó khớp với một mục được lập chỉ mục trong Cloud Search.
Để tác động đến điểm về tính thời sự của một thuộc tính văn bản, hãy xác định RetrievalImportance
trên thuộc tính văn bản trong giản đồ của bạn. Việc so khớp trên một cơ sở lưu trú có RetrievalImportance
cao sẽ mang lại điểm số cao hơn so với việc so khớp trên một cơ sở lưu trú có RetrievalImportance
thấp.
Ví dụ: giả sử bạn có nguồn dữ liệu có các đặc điểm sau:
- Nguồn dữ liệu này được dùng để lưu trữ nhật ký lỗi phần mềm.
- Mỗi lỗi đều có tên, nội dung mô tả và mức độ ưu tiên.
Hầu hết người dùng sẽ truy vấn nguồn dữ liệu này bằng tên lỗi, vì vậy, bạn sẽ đặt RetrievalImportance
trên tên thành HIGHEST
trong giản đồ.
Ngược lại, hầu hết người dùng có thể không truy vấn nguồn dữ liệu này bằng cách sử dụng nội dung mô tả về lỗi. Vì vậy, hãy đặt RetrievalImportance
trong nội dung mô tả thành DEFAULT
.
Sau đây là giản đồ mẫu chứa các chế độ cài đặt RetrievalImportance
.
{
"objectDefinitions": [
{
"name": "issues",
"propertyDefinitions": [
{
"name": "summary",
"textPropertyOptions": {
"retrievalImportance": {
"importance": HIGHEST
}
}
},
{
"name": "description",
"textPropertyOptions": {
"retrievalImportance": {
"importance": DEFAULT
}
}
},
{
"name": "label",
"isRepeatable": true,
"textPropertyOptions": {
"retrievalImportance": {
"importance": DEFAULT
}
}
},
{
"name": "comments",
"textPropertyOptions": {
"retrievalImportance": {
"importance": DEFAULT
}
}
},
{
"name": "project",
"textPropertyOptions": {
"retrievalImportance": {
"importance": HIGH
}
}
},
{
"name": "duedate",
"datePropertyOptions": {
}
},
...
]
}
]
}
Trong trường hợp tài liệu HTML, các thẻ như <title>
và <h1>
, cùng với các chế độ cài đặt định dạng như cỡ chữ và in đậm, được dùng để xác định tầm quan trọng của nhiều thuật ngữ. Nếu ContentFormat
là TEXT
, thì ItemContent
có tầm quan trọng truy xuất là DEFAULT
và nếu đó là HTML, thì tầm quan trọng truy xuất của thuộc tính này được xác định dựa trên các thuộc tính HTML.
Ảnh hưởng đến độ mới
Độ mới mẻ đo lường thời gian gần đây nhất mà một mục đã được sửa đổi và được xác định bằng các thuộc tính createTime
và updateTime
trong ItemMetadata
.
Các mục cũ hơn sẽ bị hạ cấp trong kết quả tìm kiếm.
Bạn có thể ảnh hưởng đến cách tính độ mới của một đối tượng bằng cách điều chỉnh freshnessProperty
và freshnessDuration
của FreshnessOptions
trong giản đồ.
freshnessProperty
cho phép bạn sử dụng các thuộc tính ngày hoặc dấu thời gian để tính toán độ mới thay vì updateTime
mặc định.
Trong ví dụ trước về hệ thống theo dõi lỗi phần mềm, ngày đến hạn có thể được dùng làm freshnessProperty
để các mục có ngày đến hạn gần nhất với ngày hiện tại được coi là "mới hơn" và được tăng thứ hạng. Dưới đây là giản đồ mẫu chứa các chế độ cài đặt freshnessProperty
:
{
"objectDefinitions": [
{
"name": "issues",
"options": {
"freshnessOptions": {
"freshnessProperty": "duedate"
}
},
"propertyDefinitions": [
{
"name": "summary",
"textPropertyOptions": {
"retrievalImportance": {
"importance": HIGHEST
}
}
},
{
"name": "duedate",
"datePropertyOptions": {
}
},
...
]
}
]
}
Sử dụng freshnessDuration
để xác định thời điểm một mục được coi là đã lỗi thời.
Ví dụ: bạn có thể có một nguồn dữ liệu không được lập chỉ mục thường xuyên hoặc bạn không muốn độ mới ảnh hưởng đến thứ hạng. Bạn có thể đạt được mục tiêu này bằng cách chỉ định một giá trị cao cho freshnessDuration
.
Giả sử bạn có một nguồn dữ liệu chứa thông tin hồ sơ nhân viên. Trong trường hợp này, bạn nên có freshnessDuration
cao vì những thay đổi đối với thông tin về nhân viên thường không liên quan đến thứ hạng của nhân viên đó. Sau đây là giản đồ mẫu chứa chế độ cài đặt freshnessDuration
:
{
"objectDefinitions": [
{
"name": "people",
"options": {
"freshnessOptions": {
"freshnessDuration": "315360000s", # 100 years
}
},
}
]
}
Bạn cũng có thể đặt freshnessDuration
thành một giá trị rất nhỏ cho các nguồn dữ liệu có nội dung thay đổi nhanh chóng, chẳng hạn như nguồn dữ liệu chứa các bài viết tin tức.
Trong trường hợp này, các tài liệu được tạo hoặc sửa đổi gần đây nhất là phù hợp nhất.
Dưới đây là giản đồ mẫu chứa chế độ cài đặt freshnessDuration
cho một nguồn dữ liệu chứa nội dung thay đổi nhanh chóng:
{
"objectDefinitions": [
{
"name": "news",
"options": {
"freshnessOptions": {
"freshnessDuration": "259200s", # 3 days
}
},
}
]
}
Ảnh hưởng đến chất lượng
Chất lượng là thước đo độ chính xác và hữu ích của một mục. Một nguồn dữ liệu có thể chứa nhiều tài liệu tương tự về ngữ nghĩa, mỗi tài liệu có một mức chất lượng khác nhau. Bạn có thể chỉ định giá trị chất lượng từ 0 đến 1 bằng cách sử dụng SearchQualityMetadata
.
Các mục có giá trị cao hơn sẽ được tăng thứ hạng so với các mục có giá trị thấp hơn. Chỉ sử dụng chế độ cài đặt này nếu bạn cần tác động hoặc nâng cao chất lượng của một mục bên ngoài thông tin được cung cấp cho Cloud Search.
Ví dụ: giả sử bạn có một nguồn dữ liệu chứa các tài liệu về lợi ích của nhân viên. Bạn có thể sử dụng SearchQualityMetadata
để tăng thứ hạng của tài liệu do nhân viên Nhân sự soạn so với tài liệu do nhân viên khác soạn.
Sau đây là giản đồ mẫu chứa các chế độ cài đặt SearchQualityMetadata
cho các vấn đề trong hệ thống theo dõi lỗi:
{
"name": "datasources/.../items/issue1",
"acl": {
...
},
"metadata": {
"title": "Issue 1"
"objectType": "issues"
},
...
}
{
"name": "datasources/.../items/issue2",
"acl": {
...
},
"metadata": {
"title": "Issue 2"
"objectType": "issues"
"searchQualityMetadata": {
"quality": 0.5
}
},
...
}
{
"name": "datasources/.../items/issue3",
"acl": {
...
},
"metadata": {
"title": "Issue 3"
"objectType": "issues"
"searchQualityMetadata": {
"quality": 1
}
},
...
}
Với giản đồ này, khi người dùng tìm kiếm bằng cụm từ tìm kiếm "vấn đề", Vấn đề 3 trong giản đồ (chất lượng là 1) sẽ được xếp hạng cao hơn Vấn đề 2 (chất lượng là 0,5) và Vấn đề 1 (nếu không có giá trị nào được chỉ định, chất lượng mặc định là 0).
Ảnh hưởng bằng cách sử dụng loại trường
Cloud Search cho phép bạn tác động đến thứ hạng dựa trên giá trị của thuộc tính enum hoặc số nguyên. Đối với mỗi thuộc tính số nguyên hoặc enum, bạn có thể chỉ định một OrderedRanking
. Chế độ cài đặt này có các giá trị sau:
NO_ORDER
(mặc định): Thuộc tính này không ảnh hưởng đến thứ hạng.ASCENDING
: Các mục có giá trị số nguyên hoặc thuộc tính enum cao hơn sẽ được tăng thứ hạng so với các mục có giá trị thấp hơn.DESCENDING
: Các mục có giá trị thấp hơn của thuộc tính số nguyên hoặc enum sẽ được tăng thứ hạng so với các mục có giá trị cao hơn.
Ví dụ: giả sử mỗi lỗi trong hệ thống theo dõi lỗi có một thuộc tính enum để lưu trữ mức độ ưu tiên của lỗi là HIGH
(1), MEDIUM
(2) hoặc LOW
(3). Trong trường hợp này, việc đặt OrderedRanking
thành DESCENDING
sẽ giúp tăng thứ hạng cho các lỗi có mức độ ưu tiên HIGH
so với các lỗi có mức độ ưu tiên LOW
.
Sau đây là giản đồ mẫu chứa các chế độ cài đặt OrderedRanking
cho các vấn đề trong hệ thống theo dõi lỗi:
{
"objectDefinitions": [
{
"name": "issues",
"options": {
"freshnessOptions": {
"freshnessProperty": "duedate",
}
},
"propertyDefinitions": [
{
"name": "summary",
"textPropertyOptions": {
"retrievalImportance": {
"importance": HIGHEST
}
}
},
{
"name": "duedate",
"datePropertyOptions": {
}
},
{
"name": "priority",
"enumPropertyOptions": {
"possibleValues": [
{
"stringValue": "HIGH",
"integerValue": 1
},
{
"stringValue": "MEDIUM",
"integerValue": 2
},
{
"stringValue": "LOW",
"integerValue": 3
}
],
"orderedRanking": DESCENDING,
}
},
...
]
}
]
}
Hệ thống theo dõi lỗi cũng có thể có một thuộc tính số nguyên có tên là votes
dùng để thu thập ý kiến phản hồi của người dùng về tầm quan trọng tương đối của một lỗi. Bạn có thể sử dụng thuộc tính votes
để ảnh hưởng đến thứ hạng bằng cách tăng mức độ quan trọng cho các lỗi có nhiều lượt bình chọn nhất. Trong trường hợp này, bạn có thể chỉ định OrderedRanking
là ASCENDING
cho thuộc tính votes
để các vấn đề có nhiều lượt bình chọn nhất được tăng thứ hạng. Sau đây là giản đồ mẫu chứa các chế độ cài đặt OrderedRanking
cho các vấn đề trong hệ thống theo dõi lỗi:
{
"objectDefinitions": [
{
"name": "issues",
"propertyDefinitions": [
{
"name": "summary",
"textPropertyOptions": {
"retrievalImportance": {
"importance": HIGHEST
}
}
},
{
"name": "description",
"textPropertyOptions": {
"retrievalImportance": {
"importance": DEFAULT
}
}
},
{
"name": "votes",
"integerPropertyOptions": {
"orderedRanking": ASCENDING,
"minimumValue": 0,
"maximumValue": 1000,
}
},
...
]
}
]
}
Ảnh hưởng đến thứ hạng thông qua tính năng mở rộng cụm từ tìm kiếm
Mở rộng cụm từ tìm kiếm là mở rộng các cụm từ trong cụm từ tìm kiếm, sử dụng từ đồng nghĩa và cách viết để truy xuất kết quả phù hợp hơn.
Sử dụng từ đồng nghĩa để ảnh hưởng đến kết quả tìm kiếm
Cloud Search sử dụng từ đồng nghĩa được suy ra từ nội dung công khai trên web để mở rộng các từ khoá tìm kiếm. Bạn cũng có thể xác định các từ đồng nghĩa tuỳ chỉnh để nắm bắt thuật ngữ của riêng tổ chức, chẳng hạn như các từ viết tắt phổ biến dùng trong một tổ chức hoặc thuật ngữ theo ngành cụ thể.
Bạn có thể xác định từ đồng nghĩa tuỳ chỉnh trong một nguồn dữ liệu hoặc dưới dạng một nguồn dữ liệu riêng biệt. Theo mặc định, các từ đồng nghĩa được áp dụng cho tất cả các nguồn dữ liệu trên tất cả các ứng dụng tìm kiếm. Tuy nhiên, bạn có thể nhóm các từ đồng nghĩa theo nguồn dữ liệu và ứng dụng tìm kiếm. Để biết thông tin về cách xác định các từ đồng nghĩa tuỳ chỉnh, bao gồm cả việc nhóm theo ứng dụng tìm kiếm, hãy tham khảo phần Xác định từ đồng nghĩa.
Sử dụng chính tả để tác động đến kết quả tìm kiếm
Cloud Search cung cấp nội dung đề xuất về chính tả dựa trên các mô hình được tạo bằng dữ liệu công khai của Google Tìm kiếm. Nếu phát hiện lỗi chính tả trong ngữ cảnh của một truy vấn, thì Cloud Search sẽ trả về truy vấn được đề xuất trong SpellResult
.
Người dùng có thể thấy cách viết được đề xuất dưới dạng đề xuất. Ví dụ: người dùng có thể đánh sai chính tả cụm từ truy vấn "employe" và có thể nhận được đề xuất "Bạn có phải muốn nói đến employee không?"
Tìm kiếm trên đám mây cũng sử dụng nội dung sửa lỗi chính tả làm từ đồng nghĩa để giúp truy xuất các tài liệu có thể bị bỏ lỡ do lỗi chính tả.
Ảnh hưởng đến thứ hạng thông qua chế độ cài đặt ứng dụng tìm kiếm
Như đã đề cập trong phần Giới thiệu về Google Cloud Search, Ứng dụng tìm kiếm là một nhóm các chế độ cài đặt, khi được liên kết với giao diện tìm kiếm, sẽ cung cấp thông tin theo ngữ cảnh về các lượt tìm kiếm. Các cấu hình sau đây cho phép bạn tác động đến thứ hạng thông qua ứng dụng tìm kiếm:
- Cấu hình điểm số
- Cấu hình nguồn
Hai phần sau đây giải thích cách các cấu hình này hữu ích trong việc ảnh hưởng đến việc xếp hạng.
Điều chỉnh cấu hình tính điểm
Đối với mỗi ứng dụng tìm kiếm, bạn có thể chỉ định một ScoringConfig dùng để kiểm soát việc áp dụng một số tín hiệu trong quá trình xếp hạng. Hiện tại, bạn có thể tắt tính năng làm mới và cá nhân hoá.
Nếu bạn tắt tính năng độ mới, thì tính năng này sẽ bị tắt cho tất cả các nguồn dữ liệu được liệt kê trong ứng dụng tìm kiếm, bất kể các tuỳ chọn độ mới được chỉ định trong giản đồ cho nguồn dữ liệu. Tương tự, nếu bạn tắt tính năng cá nhân hoá, thì mức tăng chủ sở hữu và mức tăng lượt tương tác sẽ không ảnh hưởng đến thứ hạng.
Để xem hướng dẫn từng bước về cách định cấu hình chế độ cài đặt này, hãy tham khảo bài viết Tuỳ chỉnh trải nghiệm tìm kiếm trong Cloud Search.
Điều chỉnh cấu hình nguồn
Cấu hình nguồn cho phép bạn chỉ định chế độ cài đặt cấp nguồn dữ liệu trong một ứng dụng tìm kiếm. Các chế độ cài đặt sau đây được hỗ trợ:
- Tầm quan trọng của nguồn
- Chèn lấn
Thiết lập tầm quan trọng của nguồn
Mức độ quan trọng của nguồn đề cập đến mức độ quan trọng tương đối của một nguồn dữ liệu trong ứng dụng tìm kiếm. Bạn có thể chỉ định chế độ cài đặt này tại trường SourceImportance
bên trong SourceScoringConfig
.
Các mục từ một nguồn dữ liệu có tầm quan trọng của nguồn là HIGH
sẽ được tăng thứ hạng so với các mục từ một nguồn dữ liệu có tầm quan trọng của nguồn là DEFAULT
hoặc LOW
. Sử dụng chế độ cài đặt này để ảnh hưởng đến thứ hạng khi bạn cho rằng người dùng sẽ ưu tiên kết quả từ một số nguồn dữ liệu nhất định.
Ví dụ: giả sử bạn có một cổng hỗ trợ sản phẩm chứa dữ liệu khắc phục sự cố bên ngoài và bên trong. Trong trường hợp này, bạn nên định cấu hình ứng dụng tìm kiếm để ưu tiên kết quả từ nguồn dữ liệu nội bộ.
Để biết hướng dẫn từng bước về cách định cấu hình chế độ cài đặt này, hãy tham khảo bài viết Tuỳ chỉnh trải nghiệm tìm kiếm trong Cloud Search.
Đặt tình trạng đông đúc
Crowding (Tình trạng ùn tắc) đề cập đến số lượng kết quả tối đa có thể được trả về từ một nguồn dữ liệu trong ứng dụng tìm kiếm. Bạn có thể kiểm soát giá trị này bằng cách sử dụng trường numResults
trong SourceCrowdingConfig
.
Giá trị này mặc định là 3, nghĩa là nếu chúng tôi đã hiển thị 3 kết quả từ một nguồn dữ liệu, thì Cloud Search sẽ bắt đầu hiển thị kết quả từ các nguồn dữ liệu khác. Các mặt hàng từ nguồn dữ liệu đầu tiên chỉ được xem xét lại nếu tất cả các nguồn dữ liệu đã đạt đến giới hạn về tình trạng lộn xộn hoặc không còn kết quả nào từ các nguồn dữ liệu khác.
Chế độ cài đặt này giúp đảm bảo sự đa dạng của kết quả tìm kiếm và ngăn một nguồn dữ liệu thống trị trang kết quả tìm kiếm.
Để xem hướng dẫn từng bước về cách định cấu hình chế độ cài đặt này, hãy tham khảo bài viết Tuỳ chỉnh trải nghiệm tìm kiếm trong Cloud Search.
Tác động đến thứ hạng thông qua hoạt động cá nhân hoá
Cá nhân hoá là việc trình bày kết quả tìm kiếm được cá nhân hoá dựa trên từng người dùng truy cập vào kết quả. Bạn có thể tác động đến việc xếp hạng bằng cách ưu tiên các mặt hàng dựa trên những tiêu chí sau:
- Quyền sở hữu mục
- Lượt tương tác với mục
- Số lượt nhấp của người dùng
- Ngôn ngữ của mặt hàng
Ba phần sau đây trình bày cách tác động đến chất lượng tìm kiếm dựa trên các tiêu chí này.
Xếp hạng mức độ ảnh hưởng dựa trên quyền sở hữu mặt hàng
Quyền sở hữu mặt hàng đề cập đến việc tăng thứ hạng cho các mặt hàng do người dùng thực hiện cụm từ tìm kiếm sở hữu. Mỗi mục có một ItemAcl
với trường owners
. Nếu người dùng thực thi truy vấn là chủ sở hữu của một mặt hàng, thì theo mặc định, mặt hàng đó sẽ được tăng thứ hạng. Bạn có thể tắt tính năng cá nhân hoá trong ứng dụng tìm kiếm.
Tăng thứ hạng dựa trên lượt tương tác với mặt hàng
Tương tác với mục là việc tăng thứ hạng cho các mục mà người dùng truy vấn tìm kiếm đã tương tác (xem, bình luận, chỉnh sửa, v.v.).
Các tín hiệu tương tác với mục được tự động thu thập cho các sản phẩm của Google Workspace như Drive và Gmail. Đối với các sản phẩm khác, bạn có thể cung cấp dữ liệu tương tác ở cấp mặt hàng, bao gồm cả loại tương tác (xem, chỉnh sửa), dấu thời gian của lượt tương tác và chủ thể (người dùng đã tương tác với mặt hàng). Xin lưu ý rằng các mục có lượt tương tác gần đây sẽ được tăng thứ hạng cao hơn.
Tăng thứ hạng dựa trên số lượt nhấp của người dùng
Cloud Search thu thập số lượt nhấp vào kết quả tìm kiếm hiện tại và sử dụng số liệu này để cải thiện thứ hạng cho các lượt tìm kiếm trong tương lai bằng cách tăng cường các mục mà cùng một người dùng đã nhấp vào trước đó.
Ảnh hưởng đến thứ hạng thông qua việc diễn giải truy vấn
Tính năng diễn giải truy vấn của Cloud Search sẽ tự động diễn giải các toán tử và bộ lọc trong truy vấn của người dùng, sau đó chuyển đổi các phần tử đó thành một truy vấn có cấu trúc dựa trên toán tử. Tính năng diễn giải truy vấn sử dụng các toán tử được xác định trong giản đồ, cùng với các tài liệu được lập chỉ mục, để suy ra ý nghĩa của truy vấn của người dùng. Tính năng này cho phép người dùng tìm kiếm bằng từ khoá tối thiểu nhưng vẫn thu được kết quả chính xác. Để biết thêm thông tin, hãy tham khảo bài viết Cấu trúc giản đồ để diễn giải truy vấn một cách tối ưu.
Tăng thứ hạng dựa trên ngôn ngữ của mục
Ngôn ngữ đề cập đến việc hạ hạng các mục có ngôn ngữ không khớp với ngôn ngữ của cụm từ tìm kiếm. Các yếu tố sau ảnh hưởng đến thứ hạng của các mục dựa trên ngôn ngữ:
Ngôn ngữ truy vấn. Ngôn ngữ được tự động phát hiện của cụm từ tìm kiếm hoặc
languageCode
được chỉ định trongRequestOptions
.Nếu tạo giao diện tìm kiếm tuỳ chỉnh, bạn nên đặt
languageCode
thành ngôn ngữ giao diện hoặc lựa chọn ngôn ngữ của người dùng (ví dụ: ngôn ngữ của trình duyệt web hoặc trang giao diện tìm kiếm). Ngôn ngữ truy vấn được phát hiện tự động sẽ được ưu tiên hơnlanguageCode
để chất lượng tìm kiếm không bị ảnh hưởng khi người dùng nhập truy vấn bằng ngôn ngữ khác với giao diện của họ.Ngôn ngữ của mặt hàng.
contentLanguage
được đặt trongItemMetadata
tại thời điểm lập chỉ mục hoặc ngôn ngữ nội dung do Cloud Search tự động phát hiện.Nếu
contentLanguage
của tài liệu bị để trống tại thời điểm lập chỉ mục vàItemContent
được điền sẵn, thì Tìm kiếm trên đám mây sẽ cố gắng phát hiện ngôn ngữ được sử dụng trongItemContent
và lưu trữ ngôn ngữ đó trong nội bộ. Ngôn ngữ được phát hiện tự động sẽ không được thêm vào trườngcontentLanguage
.
Nếu ngôn ngữ của truy vấn và mục khớp với nhau, thì không có tính năng giảm hạng ngôn ngữ nào được áp dụng. Nếu các chế độ cài đặt này không khớp, thì mặt hàng sẽ bị hạ cấp. Việc hạ cấp ngôn ngữ không được áp dụng cho các tài liệu có contentLanguage
trống và Tìm kiếm trên đám mây không thể tự động phát hiện ngôn ngữ. Do đó, thứ hạng của một tài liệu sẽ không bị ảnh hưởng nếu Cloud Search không thể phát hiện ngôn ngữ của tài liệu đó.
Tăng thứ hạng dựa trên ngữ cảnh của mặt hàng
Bạn có thể tăng thứ hạng cho các mục liên quan hơn đến bối cảnh của cụm từ tìm kiếm. Ngữ cảnh (contextAttributes
) là một tập hợp các thuộc tính được đặt tên mà bạn có thể chỉ định trong quá trình lập chỉ mục và trong yêu cầu tìm kiếm để cung cấp ngữ cảnh cho một cụm từ tìm kiếm cụ thể.
Ví dụ: giả sử một mục, chẳng hạn như tài liệu về lợi ích của nhân viên, liên quan hơn trong ngữ cảnh của Location
và Department
, chẳng hạn như thành phố (San Francisco
), tiểu bang (California
), quốc gia (USA
) và Department
(Engineering
). Trong trường hợp này, bạn có thể lập chỉ mục mục đó bằng các thuộc tính được đặt tên sau:
{
...
"metadata": {
"contextAttributes": [
{
name: "Location"
values: [
"San Francisco",
"California",
"USA"
],
},
{
name: "Department"
values: [
"Engineering"
],
}
],
},
...
}
Khi người dùng nhập cụm từ tìm kiếm "lợi ích" vào giao diện tìm kiếm, bạn có thể đưa thông tin về vị trí và bộ phận của người dùng vào yêu cầu tìm kiếm. Ví dụ: sau đây là một yêu cầu tìm kiếm có chứa thông tin về vị trí và phòng ban của một kỹ sư ở Chicago:
{
...
"contextAttributes": [
{
name: "Location"
values: [
"Chicago",
"Illinois",
"USA"
],
},
{
name: "Department"
values: [
"Engineering"
],
}
],
...
}
Vì cả mục được lập chỉ mục và yêu cầu tìm kiếm đều chứa thuộc tính "Phòng=Kỹ thuật" và "Vị trí=Hoa Kỳ", nên mục được lập chỉ mục (tài liệu về lợi ích cho nhân viên) sẽ xuất hiện ở vị trí cao hơn trong kết quả tìm kiếm.
Bây giờ, giả sử một người dùng khác, một Kỹ sư ở Ấn Độ, nhập cụm từ tìm kiếm về "lợi ích" vào giao diện tìm kiếm. Dưới đây là một yêu cầu tìm kiếm chứa thông tin về vị trí và bộ phận của họ:
{
...
"contextAttributes": [
{
name: "Location"
values: [
"Bengaluru",
"Karnataka",
"India"
],
},
{
name: "Department"
values: [
"Engineering"
],
}
],
...
}
Vì cả mục được lập chỉ mục và yêu cầu tìm kiếm chỉ chứa thuộc tính " thách thức=Kỹ thuật", mục được lập chỉ mục chỉ xuất hiện cao hơn một chút trong kết quả tìm kiếm (khi so sánh với cụm từ tìm kiếm đầu tiên về "lợi ích" do một Kỹ sư nhập tại Chicago Illinois, Hoa Kỳ).
Sau đây là một số ví dụ về ngữ cảnh mà bạn có thể sử dụng để tăng thứ hạng:
- Vị trí: Các mục có thể phù hợp hơn với người dùng ở một vị trí cụ thể, chẳng hạn như một toà nhà, thành phố, quốc gia hoặc khu vực.
- Vai trò công việc: Các mục có thể phù hợp hơn với người dùng ở một vai trò công việc cụ thể, chẳng hạn như Nhà văn kỹ thuật hoặc Kỹ sư.
- Bộ phận: Các mục có thể phù hợp hơn với một số bộ phận nhất định, chẳng hạn như Bán hàng hoặc Tiếp thị.
- Cấp công việc: Một số mục có thể phù hợp hơn với một số cấp công việc nhất định, chẳng hạn như Giám đốc hoặc Giám đốc điều hành.
- Loại nhân viên: Các mục có thể phù hợp hơn với một số kiểu nhân viên nhất định, chẳng hạn như nhân viên toàn thời gian và bán thời gian.
- Thâm niên: Các mục có thể liên quan hơn đến thâm niên công tác của một nhân viên, chẳng hạn như nhân viên mới tuyển dụng.
Ảnh hưởng đến thứ hạng thông qua mức độ phổ biến của mặt hàng
Cloud Search tăng thứ hạng cho những mặt hàng phổ biến; tức là những mặt hàng đã nhận được lượt nhấp trong các cụm từ tìm kiếm gần đây sẽ được nâng cao.
Ảnh hưởng đến thứ hạng thông qua lượt nhấp
Cloud Search thu thập các lượt nhấp vào kết quả tìm kiếm hiện tại rồi sử dụng kết quả này để cải thiện thứ hạng cho các lượt tìm kiếm trong tương lai bằng cách tăng cường các mục phổ biến cho một cụm từ tìm kiếm cụ thể.
Tóm tắt các chế độ cài đặt chất lượng tìm kiếm được đề xuất và không bắt buộc
Bảng sau đây liệt kê tất cả các chế độ cài đặt chất lượng tìm kiếm nên dùng và không bắt buộc. Những đề xuất này sẽ giúp bạn khai thác tối đa các mô hình xếp hạng của Cloud Search.
Xem xét | Vị trí | Đề xuất/không bắt buộc | Thông tin chi tiết |
---|---|---|---|
Cài đặt giản đồ | |||
Trường ItemContent | ItemContent | Đề xuất | Khi tạo hoặc cập nhật giản đồ, hãy điền nội dung phi cấu trúc của một mặt hàng. Trường này dùng để tạo đoạn mã. |
RetrievalImportance trường | RetrievalImportance | Đề xuất | Khi tạo hoặc cập nhật giản đồ, hãy đặt cho các thuộc tính văn bản rõ ràng là quan trọng hoặc theo chủ đề. |
FreshnessOptions | FreshnessOptions | Không bắt buộc | Khi tạo hoặc cập nhật giản đồ, hãy thiết lập để đảm bảo các mục không bị hạ cấp do dữ liệu không chính xác hoặc trường hợp thiếu dữ liệu. |
Cài đặt lập chỉ mục | |||
createTime /updateTime | ItemMetadata | Đề xuất | Điền trong quá trình lập chỉ mục một mục. |
contentLanguage | ItemMetadata | Đề xuất | Điền trong quá trình lập chỉ mục một mục. Nếu không có, Cloud Search sẽ cố gắng phát hiện ngôn ngữ được sử dụng trong ItemContent . |
Trường owners | ItemAcl() | Đề xuất | Điền trong quá trình lập chỉ mục một mục. |
Từ đồng nghĩa tuỳ chỉnh | Giản đồ _dictionaryEntry | Đề xuất | Xác định ở cấp nguồn dữ liệu hoặc dưới dạng nguồn dữ liệu riêng biệt trong quá trình lập chỉ mục. |
quality trường | SearchQualityMetadata | Không bắt buộc | Để tăng chất lượng cơ bản so với các mục khác có ngữ nghĩa tương tự, hãy đặt chất lượng trong quá trình lập chỉ mục. Việc đặt trường này cho tất cả các mặt hàng trong nguồn dữ liệu sẽ vô hiệu hoá hiệu lực của trường. |
dữ liệu tương tác ở cấp mặt hàng | interaction | Không bắt buộc | Nếu nguồn dữ liệu ghi lại và cung cấp quyền truy cập vào các lượt tương tác của người dùng, hãy điền các lượt tương tác cho từng mục trong quá trình lập chỉ mục. |
thuộc tính số nguyên/enum | OrderedRanking | Không bắt buộc | Khi thứ tự của các mục có liên quan, hãy chỉ định thứ hạng theo thứ tự cho các thuộc tính số nguyên và enum trong quá trình lập chỉ mục. |
Cài đặt ứng dụng tìm kiếm | |||
Personalization=false | ScoringConfig hoặc sử dụng giao diện người dùng quản trị của CloudSearch | Đề xuất | Khi tạo hoặc cập nhật ứng dụng tìm kiếm. Đảm bảo bạn cung cấp thông tin chính xác về chủ sở hữu như mô tả trong bài viết Ảnh hưởng đến thứ hạng thông qua tính năng cá nhân hoá |
SourceImportance trường | SourceCrowdingConfig | Không bắt buộc | Để thiên lệch kết quả từ một số nguồn dữ liệu nhất định, hãy đặt trường này. |
Trường numResults | SourceCrowdingConfig | Không bắt buộc | Để kiểm soát tính đa dạng của kết quả, hãy đặt trường này. |
Các bước tiếp theo
Dưới đây là một vài bước tiếp theo bạn có thể thực hiện:
Tìm hiểu cách tận dụng giản đồ
_dictionaryEntry
để xác định từ đồng nghĩa cho các cụm từ thường dùng trong công ty của bạn. Để sử dụng giản đồ_dictionaryEntry
, hãy tham khảo phần Xác định từ đồng nghĩa.