Python 求向量的余弦值操作
1、余弦相似度
余弦相似度衡量的是2个向量间的夹角大小,通过夹角的余弦值表示结果,因此2个向量的余弦相似度为:
余弦相似度的取值为[-1,1],值越大表示越相似。
向量夹角的余弦公式很简单,不在此赘述,直接上代码:
defcosVector(x,y): if(len(x)!=len(y)): print('errorinput,xandyisnotinthesamespace') return; result1=0.0; result2=0.0; result3=0.0; foriinrange(len(x)): result1+=x[i]*y[i]#sum(X*Y) result2+=x[i]**2#sum(X*X) result3+=y[i]**2#sum(Y*Y) #print(result1) #print(result2) #print(result3) print("resultis"+str(result1/((result2*result3)**0.5)))#结果显示 cosVector([2,1],[1,1])
一个计算二维数组余弦值的例子:
#求余弦函数 defcosVector(x,y): if(len(x)!=len(y)): print('errorinput,xandyisnotinthesamespace') return; result1=0.0; result2=0.0; result3=0.0; foriinrange(len(x)): result1+=x[i]*y[i]#sum(X*Y) result2+=x[i]**2#sum(X*X) result3+=y[i]**2#sum(Y*Y) #print("resultis"+str(result1/((result2*result3)**0.5)))#结果显示 returnresult1/((result2*result3)**0.5) #print("resultis",cosVector([2,1],[1,1])) #计算query_output(60,20)和db_output(60,20)的余弦值,用60*1的向量存储 cosResult=[[0]*1foriinrange(60)] foriinrange(60): cosResult[i][0]=cosVector(query_output[i],db_output[i]) print(cosResult) -------------------------------------------------------------------------------------------- #计算query_output和db_output的余弦值,用60*1的向量存储 rows=query_output.shape[0]#行数 cols=query_output.shape[1]#列数 cosResult=[[0]*1foriinrange(rows)] foriinrange(rows): cosResult[i][0]=cosVector(query_output[i],db_output[i]) #print(cosResult) #将结果存入文件中,并且一行一个数字 file=open('cosResult.txt','w') foriincosResult: file.write(str(i).replace('[','').replace(']','')+'\n')#\r\n为换行符 file.close()
补充:python实现余弦近似度
方法一:
defcos(vector1,vector2): dot_product=0.0 normA=0.0 normB=0.0 fora,binzip(vector1,vector2): dot_product+=a*b normA+=a**2 normB+=b**2 ifnormA==0.0ornormB==0.0: returnNone else: return0.5+0.5*dot_product/((normA*normB)**0.5)#归一化从[-1,1]到[0,1]
方法二:
num=float(A.T*B)#若为行向量则A*B.T denom=linalg.norm(A)*linalg.norm(B) cos=num/denom#余弦值 sim=0.5+0.5*cos#归一化从[-1,1]到[0,1]
以上为个人经验,希望能给大家一个参考,也希望大家多多支持毛票票。如有错误或未考虑完全的地方,望不吝赐教。
声明:本文内容来源于网络,版权归原作者所有,内容由互联网用户自发贡献自行上传,本网站不拥有所有权,未作人工编辑处理,也不承担相关法律责任。如果您发现有涉嫌版权的内容,欢迎发送邮件至:czq8825#qq.com(发邮件时,请将#更换为@)进行举报,并提供相关证据,一经查实,本站将立刻删除涉嫌侵权内容。