You need to enable JavaScript to run this app.
最新活动
产品
解决方案
定价
生态与合作
支持与服务
开发者
了解我们

CosineSimilarityinlineartimeusingLisp

余弦相似性是一种计算文本相似性的常用方法。在Lisp中实现余弦相似性可以非常快速地完成。以下是一个Lisp代码示例,它能够在线性时间内计算两个文本之间的余弦相似性:

(defun dot-product (a b)
  (apply '+ (mapcar #'* a b)))

(defun magnitude (a)
  (sqrt (dot-product a a)))

(defun cosine (a b)
  (/ (dot-product a b) (* (magnitude a) (magnitude b))))

(defun cosine-similarity (a b)
  (cosine (mapcar #'floor a) (mapcar #'floor b)))

在这个示例中,我们首先定义了三个函数:dot-product(计算两个向量的点积)、magnitude(计算向量的模长)和cosine(计算两个向量之间的余弦相似性)。

然后,我们将这些函数组合在一起来计算两个文本之间的余弦相似性。最后,我们使用mapcar函数对向量的各个元素进行舍入操作,以确保函数能够在数字上进行操作。

在使用这个实现的时候,我们只需要将要比较的文本作为两个向量的参数传入cosine-similarity函数中即可。

例如,我们要比较两段文本的相似性,可以按以下方式计算余弦相似度:

(setq a '(1 1 2 3 5 8))
(setq b '(0 1 2 3 5 7))
(cosine-similarity a b)

输出结果为0.9977730297038455,这表示两个向量的余弦相似度非常高,它们之间的相似性也很高。

通过这

本文内容通过AI工具匹配关键字智能整合而成,仅供参考,火山引擎不对内容的真实、准确或完整作任何形式的承诺。如有任何问题或意见,您可以通过联系service@volcengine.com进行反馈,火山引擎收到您的反馈后将及时答复和处理。
展开更多
面向开发者的云福利中心,ECS 60元/年,域名1元起,助力开发者快速在云上构建可靠应用

社区干货

【通俗讲解】向量数据库的崛起|社区征文

我们可以将文档的所有内容通过Vector Embedding转化为向量,然后当用户提出相关问题时,将用户的搜索内容转换成向量。接着,在数据库中搜索最相似的向量,匹配最相关的上下文,并将这些文本返回给GPT。这不仅显著减轻... 余弦相似度(Cosine Similarity)是一种衡量两个向量之间夹角余弦的度量,用于评估它们的相似性。对于两个向量 A 和 B,余弦相似度的计算公式如下:![picture.image](https://p6-volc-community-sign.byteimg.com/tos...

【AI人工智能】手把手教你,如何训练专属于自己的私人影院推荐助手

> 「回顾2022,展望2023,我正在参与[2022年终总结征文大赛活动](https://juejin.cn/post/7172462429929111559 "https://juejin.cn/post/7172462429929111559")」2022年只剩一个小尾巴了,回想年初的时候制定的 fla... for n_layer in self._movie_layers: mov_features = n_layer(mov_features) #使用余弦相似度算子,计算用户和电影的相似程度 sim = F.cosine_similarity(user_f...

CVer从0入门NLP——GPT是如何一步步诞生的|社区征文

一种常见的计算相似度的方法是余弦相似度`cosine_similarity`,结果如下:![picture.image](https://p3-volc-community-sign.byteimg.com/tos-cn-i-tlddhu82om/9a70b70f0fa7421da24effbc21bab012~tplv-tlddhu82om-... 我们一起来看看“King”这个词的词向量(这是在维基百科上训练好的),如下:`[ 0.50451 , 0.68607 , -0.59517 , -0.022801, 0.60046 , -0.13498 , -0.08813 , 0.47377 , -0.61798 , -0.31012 , -0.076666, 1.493 , ...

特惠活动

热门爆款云服务器

100%性能独享,更高内存性能更佳,学习测试、web前端、企业应用首选,每日花费低至0.55元
60.00/1212.00/年
立即购买

域名注册服务

cn/top/com等热门域名,首年低至1元,邮箱建站必选
1.00/首年起32.00/首年起
立即购买

DCDN国内流量包100G

同时抵扣CDN与DCDN两种流量消耗,加速分发更实惠
2.00/20.00/年
立即购买

CosineSimilarityinlineartimeusingLisp -优选内容

高维向量相似度搜索(pg_vector)
余弦相似度(Cosine Similarity)以及内积运算(Inner Product)。 最大支持创建 16000 维度的向量,最大支持对 2000 维度的向量建立索引。 使用插件创建插件sql create extension vector;查询插件版本sql select * fro... create index tbl_vector_tc1_idx on tbl_vector using ivfflat (tc1) with (lists = 4);说明 创建 ivfflat 索引时如不指定 opclass ,默认使用 vector_l2_ops。 ivfflat 索引要求被索引的 vector 列维度必须小于...
list
distance string 显示距离类型,衡量向量之间距离的算法。取值如下: ip:全称是 Inner Product,内积,该算法基于向量的内积,即两个元素的对应元素相乘并求和的结果计算相似度,内积值越大相似度越高。 l2:欧几里得距离,它计算两个向量的欧几里得空间距离,欧式距离越小相似度越高。 cosine:余弦相似度(Cosine Similarity),也称为余弦距离(Cosine Distance),用于计算两个高维向量的夹角余弦值从而衡量向量相似度,夹角余弦值越小表示...
list
distance string 显示距离类型,衡量向量之间距离的算法。取值如下: ip:全称是 Inner Product,内积,该算法基于向量的内积,即两个元素的对应元素相乘并求和的结果计算相似度,内积值越大相似度越高。 l2:欧几里得距离,它计算两个向量的欧几里得空间距离,欧式距离越小相似度越高。 cosine:余弦相似度(Cosine Similarity),也称为余弦距离(Cosine Distance),用于计算两个高维向量的夹角余弦值从而衡量向量相似度,夹角余弦值越小表示...
createIndex
distance string 否 DistanceType.IP 距离类型,衡量向量之间距离的算法。取值如下: DistanceType.IP:全称是 Inner Product,内积,该算法基于向量的内积,即两个元素的对应元素相乘并求和的结果计算相似度,内积值越大相似度越高。 DistanceType.L2:欧几里得距离,它计算两个向量的欧几里得空间距离,欧式距离越小相似度越高。 DistanceType.COSINE:余弦相似度(Cosine Similarity),也称为余弦距离(Cosine Distance),用于计算两个...

CosineSimilarityinlineartimeusingLisp -相关内容

CreateIndex

Distance string 否 DistanceType.IP 距离类型,衡量向量之间距离的算法。取值如下: IP:全称是 Inner Product,内积,该算法基于向量的内积,即两个元素的对应元素相乘并求和的结果计算相似度,内积值越大相似度越高。 L2:欧几里得距离,它计算两个向量的欧几里得空间距离,欧式距离越小相似度越高。 COSINE:余弦相似度(Cosine Similarity),也称为余弦距离(Cosine Distance),用于计算两个高维向量的夹角余弦值从而衡量向量相似度,...

CreateIndex

Distance string 否 DistanceType.IP 距离类型,衡量向量之间距离的算法。取值如下: IP:全称是 Inner Product,内积,该算法基于向量的内积,即两个元素的对应元素相乘并求和的结果计算相似度,内积值越大相似度越高。 L2:欧几里得距离,它计算两个向量的欧几里得空间距离,欧式距离越小相似度越高。 COSINE:余弦相似度(Cosine Similarity),也称为余弦距离(Cosine Distance),用于计算两个高维向量的夹角余弦值从而衡量向量相似度,...

from_documents

distance string 否 DistanceType.IP 距离类型,衡量向量之间距离的算法。取值如下: DistanceType.IP:全称是 Inner Product,内积,该算法基于向量的内积,即两个元素的对应元素相乘并求和的结果计算相似度,内积值越大相似度越高。 DistanceType.L2:欧几里得距离,它计算两个向量的欧几里得空间距离,欧式距离越小相似度越高。 DistanceType.COSINE:余弦相似度(Cosine Similarity),也称为余弦距离(Cosine Distance),用于计算两个...

热门爆款云服务器

100%性能独享,更高内存性能更佳,学习测试、web前端、企业应用首选,每日花费低至0.55元
60.00/1212.00/年
立即购买

域名注册服务

cn/top/com等热门域名,首年低至1元,邮箱建站必选
1.00/首年起32.00/首年起
立即购买

DCDN国内流量包100G

同时抵扣CDN与DCDN两种流量消耗,加速分发更实惠
2.00/20.00/年
立即购买

create_index

distance string 否 DistanceType.IP 距离类型,衡量向量之间距离的算法。取值如下: DistanceType.IP:全称是 Inner Product,内积,该算法基于向量的内积,即两个元素的对应元素相乘并求和的结果计算相似度,内积值越大相似度越高。 DistanceType.L2:欧几里得距离,它计算两个向量的欧几里得空间距离,欧式距离越小相似度越高。 DistanceType.COSINE:余弦相似度(Cosine Similarity),也称为余弦距离(Cosine Distance),用于计算两个...

新建索引

COSINE。必选。 IP:全称是 Inner Product,内积,该算法基于向量的内积,即两个元素的对应元素相乘并求和的结果计算相似度,内积值越大相似度越高。 L2:欧几里得距离,它计算两个向量的欧几里得空间距离,欧式距离越小相似度越高。 COSINE:余弦相似度(Cosine Similarity),也称为余弦距离(Cosine Distance),用于计算两个高维向量的夹角余弦值从而衡量向量相似度,夹角余弦值越小表示两向量的夹角越大,则两个向量差异越大。当距离类型选择...

新建索引

COSINE。必选。 IP:全称是 Inner Product,内积,该算法基于向量的内积,即两个元素的对应元素相乘并求和的结果计算相似度,内积值越大相似度越高。 L2:欧几里得距离,它计算两个向量的欧几里得空间距离,欧式距离越小相似度越高。 COSINE:余弦相似度(Cosine Similarity),也称为余弦距离(Cosine Distance),用于计算两个高维向量的夹角余弦值从而衡量向量相似度,夹角余弦值越小表示两向量的夹角越大,则两个向量差异越大。当距离类型选择...

create

distance string 否 ip 距离类型,衡量向量之间距离的算法。取值如下: ip:全称是 Inner Product,内积,该算法基于向量的内积,即两个元素的对应元素相乘并求和的结果计算相似度,内积值越大相似度越高。 l2:欧几里得距离,它计算两个向量的欧几里得空间距离,欧式距离越小相似度越高。 cosine:余弦相似度(Cosine Similarity),也称为余弦距离(Cosine Distance),用于计算两个高维向量的夹角余弦值从而衡量向量相似度,夹角余弦值越小...

create

distance string 否 ip 距离类型,衡量向量之间距离的算法。取值如下: ip:全称是 Inner Product,内积,该算法基于向量的内积,即两个元素的对应元素相乘并求和的结果计算相似度,内积值越大相似度越高。 l2:欧几里得距离,它计算两个向量的欧几里得空间距离,欧式距离越小相似度越高。 cosine:余弦相似度(Cosine Similarity),也称为余弦距离(Cosine Distance),用于计算两个高维向量的夹角余弦值从而衡量向量相似度,夹角余弦值越小...

【通俗讲解】向量数据库的崛起|社区征文

我们可以将文档的所有内容通过Vector Embedding转化为向量,然后当用户提出相关问题时,将用户的搜索内容转换成向量。接着,在数据库中搜索最相似的向量,匹配最相关的上下文,并将这些文本返回给GPT。这不仅显著减轻... 余弦相似度(Cosine Similarity)是一种衡量两个向量之间夹角余弦的度量,用于评估它们的相似性。对于两个向量 A 和 B,余弦相似度的计算公式如下:![picture.image](https://p6-volc-community-sign.byteimg.com/tos...

特惠活动

热门爆款云服务器

100%性能独享,更高内存性能更佳,学习测试、web前端、企业应用首选,每日花费低至0.55元
60.00/1212.00/年
立即购买

域名注册服务

cn/top/com等热门域名,首年低至1元,邮箱建站必选
1.00/首年起32.00/首年起
立即购买

DCDN国内流量包100G

同时抵扣CDN与DCDN两种流量消耗,加速分发更实惠
2.00/20.00/年
立即购买

产品体验

体验中心

云服务器特惠

云服务器
云服务器ECS新人特惠
立即抢购

白皮书

一图详解大模型
浓缩大模型架构,厘清生产和应用链路关系
立即获取

最新活动

爆款1核2G共享型服务器

首年60元,每月仅需5元,限量秒杀
立即抢购

火山引擎增长体验专区

丰富能力激励企业快速增长
查看详情

数据智能VeDI

易用的高性能大数据产品家族
了解详情

一键开启云上增长新空间

立即咨询