中文字幕色婷婷在线视频,最新69国产精品视频,亚洲av无码国产精品色,亚洲影院,一区二区,亚洲国产精品无码久久青草

語義搜索在您的業(yè)務(wù)和營銷計(jì)劃中是否適用,以及您如何利用它來發(fā)揮您的優(yōu)勢?

對于簡單的用戶查詢,搜索引擎可以僅僅通過關(guān)鍵詞匹配來可靠地找到正確的內(nèi)容。

"紅色烤面包機(jī)"的查詢可以找到所有標(biāo)題或描述中帶有 "烤面包機(jī)",以及顏色屬性紅色的產(chǎn)品。

紅色添加栗色等同義詞,你可以匹配更多的烤面包機(jī)。

但你必須自己添加這些同義詞。

這就是語義搜索的作用。

語義搜索試圖應(yīng)用用戶意圖以及單詞和短語的含義(或語義)來尋找正確的內(nèi)容。

它超越了關(guān)鍵詞匹配,使用可能不會立即出現(xiàn)在文本中的信息(關(guān)鍵詞本身),但與搜索者想要的東西緊密相連。

例如,用 "sweater"甚至 "sweeter"的查詢來尋找一件毛衣,對于關(guān)鍵詞搜索來說是沒有問題的,而用語義搜索來查詢 "溫暖的衣服 ""如何在冬天讓我的身體保持溫暖?"則更適合。

要了解語義搜索是否適用于您的企業(yè),以及您如何能夠最好地利用這一優(yōu)勢,就需要了解它是如何工作的,以及構(gòu)成語義搜索的各個(gè)組成部分。

語義搜索的要素是什么?

語義搜索應(yīng)用用戶意圖、語境和概念含義,將用戶查詢與相應(yīng)的內(nèi)容相匹配。

它使用矢量搜索和機(jī)器學(xué)習(xí)來返回旨在與用戶查詢相匹配的結(jié)果,即使在沒有單詞匹配的情況下。

這些組件一起工作,根據(jù)意義來檢索和排列結(jié)果。

最基本的部分之一是語境。

語境

搜索發(fā)生的語境對于理解搜索者試圖尋找的東西很重要。

語境可以是簡單的語言環(huán)境美國人搜索 "football"英國人搜索同樣的東西所需要的東西不同),也可以是更復(fù)雜的。

一個(gè)智能搜索引擎將在個(gè)人層面和群體層面上使用語境。

個(gè)人層面對結(jié)果的影響被稱為個(gè)性化。

個(gè)性化將使用個(gè)人搜索者的親和力、以前的搜索和以前的互動(dòng)來返回最適合當(dāng)前查詢的內(nèi)容。

在群體層面上,搜索引擎可以利用關(guān)于所有搜索者如何與搜索結(jié)果互動(dòng)的信息來重新排列結(jié)果,比如哪些結(jié)果最常被點(diǎn)擊,甚至某些結(jié)果何時(shí)比其他結(jié)果更受歡迎的季節(jié)性。

這再次顯示了語義搜索如何為搜索帶來智能。

語義搜索還可以利用文本中的語境。

我們已經(jīng)討論過,同義詞在各種搜索中都很有用,而且可以通過將查詢的匹配內(nèi)容擴(kuò)大到相關(guān)內(nèi)容來改善關(guān)鍵詞搜索。

但我們也知道,同義詞并不是萬能的--有時(shí)兩個(gè)詞在一個(gè)語境中是等價(jià)的,而在另一個(gè)語境中則不是。

用戶意圖

任何搜索引擎的最終目標(biāo)都是幫助用戶成功完成一項(xiàng)任務(wù)。

這個(gè)任務(wù)可能是閱讀新聞文章,購買服裝,或?qū)ふ乙环菸募?/span>

搜索引擎需要弄清楚用戶想要做什么,或者用戶的意圖是什么。

我們在一個(gè)電子商務(wù)網(wǎng)站上搜索時(shí)可以看到這一點(diǎn)。

當(dāng)用戶輸入查詢 "jordans"時(shí),搜索會自動(dòng)過濾到 ""這個(gè)類別。

這預(yù)示著用戶的意圖是尋找鞋子,而不是JORDAN杏仁(這應(yīng)該屬于 "食品和小吃"類別)。

通過提前了解用戶的意圖,搜索引擎可以返回最相關(guān)的結(jié)果,而不是用那些文字上匹配但不相關(guān)的項(xiàng)目來干擾用戶。

當(dāng)在搜索的頂部應(yīng)用排序時(shí),這可能更有意義,比如價(jià)格從低到高。

這是一個(gè)查詢分類的例子。

對查詢進(jìn)行分類并限制結(jié)果集將確保只有相關(guān)的結(jié)果出現(xiàn)。

關(guān)鍵詞搜索和語義搜索之間的區(qū)別

我們已經(jīng)看到了語義搜索的智能方式,但是值得多看看它與關(guān)鍵詞搜索有什么不同。

雖然關(guān)鍵詞搜索引擎也引入了自然語言處理,以改進(jìn)這種詞與詞之間的匹配。通過使用同義詞、刪除停頓詞、忽略復(fù)數(shù)等方法,但這種處理仍然依賴于詞與詞之間的匹配。

但是,語義搜索可以返回沒有匹配文本的結(jié)果。

這就涉及到了關(guān)鍵詞搜索和語義搜索之間的巨大差異,也就是查詢和記錄之間的匹配方式。

為了簡化一些,關(guān)鍵詞搜索是通過對文本的匹配來進(jìn)行的。

因?yàn)槲谋举|(zhì)量上的重疊,"soap"總是會與 "soap""soapy"相匹配。

更具體地說,有足夠多的匹配字母來告訴引擎,搜索一個(gè)的用戶會想要另一個(gè)。

同樣的匹配也會告訴引擎,查詢 "soap"更有可能與匹配"soup"而不是"detergent"。

除非搜索引擎的所有者提前告訴引擎,肥皂和洗滌劑是等同的,在這種情況下,搜索引擎在確定相似性時(shí)將 "假裝 "洗滌劑實(shí)際上就是肥皂。

基于關(guān)鍵詞的搜索引擎也可以使用同義詞、替代詞或刪除查詢詞等工具,來幫助完成這項(xiàng)信息檢索任務(wù)。

NLPNLU工具,如錯(cuò)別字容忍度、標(biāo)記化和規(guī)范化,也有助于提高檢索效果。

雖然這些都有助于提供更好的結(jié)果,但它們在更智能的匹配和概念匹配方面可能有所欠缺。

語義搜索不是什么?

語義搜索一種提高搜索質(zhì)量的強(qiáng)大方法。

因此,語義搜索的含義已經(jīng)被應(yīng)用得越來越廣泛。

通常情況下,這些搜索體驗(yàn)并不總是能夠證明這個(gè)名稱。

而雖然沒有語義搜索的官方定義,但我們可以說,它是超越了傳統(tǒng)的基于關(guān)鍵詞的搜索。

它通過納入現(xiàn)實(shí)世界的知識,根據(jù)查詢和內(nèi)容的含義來推導(dǎo)出用戶的意圖。

這就導(dǎo)致了這樣的結(jié)論:語義搜索并不是簡單地應(yīng)用NLP和向索引添加同義詞。

誠然,標(biāo)記化確實(shí)需要一些關(guān)于語言構(gòu)造的現(xiàn)實(shí)世界的知識,而同義詞則應(yīng)用對概念匹配的理解。

然而,在大多數(shù)情況下,它們?nèi)狈σ环N人工智能,而這種人工智能是搜索上升到語義水平所需要的。

由矢量搜索提供支持

正是這最后一點(diǎn),使得語義搜索既強(qiáng)大又困難。

一般來說,對于語義搜索這個(gè)術(shù)語,有一種隱含的理解是,其中涉及到某種程度的機(jī)器學(xué)習(xí)。

幾乎同樣常見的是,這也涉及到矢量搜索。

矢量搜索的工作方式是將關(guān)于一個(gè)項(xiàng)目的細(xì)節(jié)編碼為矢量,然后比較矢量以確定哪些是最相似的。

繪制矢量圖以尋找相似性

這通常也是矢量搜索的工作方式。

一個(gè)機(jī)器學(xué)習(xí)模型從網(wǎng)絡(luò)、書籍或其他來源獲取數(shù)千或數(shù)百萬的例子,然后利用這些信息進(jìn)行預(yù)測。

當(dāng)然,讓模型逐一進(jìn)行比較是不可行的,因此,模型將對它注意到的不同短語的模式進(jìn)行編碼。

除了在機(jī)器學(xué)習(xí)中,語言模型的工作并不那么透明(這也是為什么語言模型可能難以調(diào)試)。

這些編碼被儲存在一個(gè)矢量或一長串的數(shù)值中。

然后,向量搜索使用數(shù)學(xué)來計(jì)算不同向量的相似程度。

思考矢量搜索所做的相似性測量的另一種方式是想象矢量被繪制出來。

如果你試圖將一個(gè)矢量繪制成數(shù)百個(gè)維度,這是非常困難。

如果你把一個(gè)向量畫成三個(gè)維度,其原理是一樣的。

這些向量在繪制時(shí)形成一條線,問題是:這些線中哪些最接近對方?

這一原則被稱為矢量,或余弦,相似性。

矢量相似性有很多應(yīng)用。

它可以根據(jù)以前購買的產(chǎn)品進(jìn)行推薦,找到最相似的圖像,并可以確定哪些項(xiàng)目與用戶的查詢在語義上最匹配。

結(jié)論

隨著強(qiáng)大的深度學(xué)習(xí)模型和支持它們的硬件的興起,語義搜索已經(jīng)是一種強(qiáng)大的搜索應(yīng)用工具。

雖然我們在這里已經(jīng)觸及了一些不同的常見應(yīng)用,但使用矢量搜索和人工智能的應(yīng)用甚至更多。

甚至圖像搜索或從圖像中提取元數(shù)據(jù)也可以屬于語義搜索。

如果做得正確,語義搜索將利用現(xiàn)實(shí)世界的知識,特別是通過機(jī)器學(xué)習(xí)和矢量相似性,將用戶查詢與相應(yīng)的內(nèi)容相匹配。

原文來自邦閱網(wǎng) (52by.com) - fx21ms.cn/article/83741

聲明:該文觀點(diǎn)僅代表作者本人,邦閱網(wǎng)系信息發(fā)布平臺,僅提供信息存儲空間服務(wù),若存在侵權(quán)問題,請及時(shí)聯(lián)系邦閱網(wǎng)或作者進(jìn)行刪除。

評論
登錄 后參與評論
發(fā)表你的高見