【info】去年与Katie Crutchfield组建了组合Plains的美国创作女歌手Jess Williamson将于6月9日发行最新个人专辑Time Ain’t Accidental,预购:https://t.cn/A6CkekdX

Tracklist:
01 Time Ain’t Accidental
02 Hunter
03 Chasing Spirits
04 Tobacco Two Step
05 God in Everything
06 A Few Seasons
07 Topanga Two Step
08 Something’s in the Way
09 Stampede
10 I’d Come to Your Call
11 Roads

###Third code of Transn Internship

def detect_contains_term(input_src, input_target):

detect_result = {}

# print('原文不存在')

data_contains_src = dot_term_info[dot_term_info['src_text'].str.contains(input_src)] # 查找src_text中包含input_src字符串的行

# print(len(data_contains_src))

if len(data_contains_src) > 0: # contains包含字符串查找

# 包含

detect_result['term_input_result'] = '存在相似术语'

data_contains_src = data_contains_src.drop_duplicates() # 去重

# data_contains_src_tran = pd.unique(data_contains_src['target_text'])

data_contains_src_tran = data_contains_src['target_text'].to_numpy() # 转为numpy格式,便于后续求相似度

# 求max_distance

distance = []

for contains_target_text in data_contains_src_tran:

distance.append(cal_distance(contains_target_text, input_target))

max_distance = max(distance)

max_distance_target = data_contains_src_tran[distance.index(max_distance)] # max_distance对应的译文

max_distance_target_src = data_contains_src[data_contains_src['target_text'] == max_distance_target]['src_text'].tolist() # max_distance对应的译文对应的原文,可能有重复

max_distance_target_term_id = data_contains_src[data_contains_src['target_text'] == max_distance_target]['term_id'].tolist() # max_distance对应的译文对应的term_id,可能有重复

# print(max_distance_target_src, max_distance_target)

detect_result['term_id'] = [i for i in max_distance_target_term_id]

detect_result['term_tran_text'] = max_distance_target

# input_src与取出的src_text的distance取average

src_distance = 0

for j in max_distance_target_src:

src_distance += cal_distance(input_src, j)

src_distance = src_distance/len(max_distance_target_src)

# 计算正确率

acc_pro = (max_distance+src_distance)/2

detect_result['term_ratio'] = acc_pro

else:

# 不包含

detect_result['term_input_result'] = '不存在相似的术语'

detect_result['term_id'] = ''

detect_result['term_tran_text'] = ''

detect_result['term_ratio'] = ''

# acc_pro = 'Non_existent,Non_contains,to be continue...'

return detect_result

###Third code of Transn Internship

def detect_match_term(input_target, data_match_src):

detect_result = {}

# print('原文存在')

data_match_src_tran = pd.unique(data_match_src['target_text']) # 取出原文对应的译文的行,去重

# [2.1.1] 计算input_target和target_text之间的max_distance

distance = []

for target_text in data_match_src_tran:

distance.append(cal_distance(target_text, input_target))

max_distance = max(distance) # when max_distance==1,input_target exist,else not exist

if max_distance == 1:

# print('原文存在')

detect_result['term_input_result'] = '存在一样术语'

else:

# print('译文不存在')

detect_result['term_input_result'] = '存在译文不一样术语'

max_distance_target = data_match_src_tran[distance.index(max_distance)] # 取出max_distance对应的译文

max_distance_target_term_id = dot_term_info.loc[dot_term_info['target_text'] == max_distance_target]['term_id'].tolist() #取出max_distance对应的译文的term_id

detect_result['term_id'] = [i for i in max_distance_target_term_id]

detect_result['term_tran_text'] = max_distance_target

# print('术语库中存在的原文及与输入译文最相近对应的译文为:', input_src, max_distance_target)

# max_distance_target

# [2.1.2]

conditional_pro = len(data_match_src.loc[data_match_src['target_text'] == max_distance_target]) / len( data_match_src) # 计算条件概率

# [2.1.3]

acc_pro = (max_distance + conditional_pro) / 2 # 计算正确率

detect_result['term_ratio'] = acc_pro

return detect_result


发布     👍 0 举报 写留言 🖊   
✋热门推荐
  • !还有图三提到的gf,lyp?
  • 唐小姐 露露子宝宝宝贝老婆是经历 是过程 是结局我对你是超级爱的 我叙述的很贫瘠 但是我对你的喜欢对你的爱热烈而富满 梦里的画面像电影回放 像刚出
  • 花开花败,春去秋来沙漏里的时间不知为何加快脚步那安静躺在漏底的细沙每一粒都是个抹不去的回忆也许时间真的可以改变一切曾经时常伴我身边的人哪去了?或许是人和心都不属
  • 所谓“中原地区文明洼地现象”的说法似乎再度被坐实。”这个村庄离滩小关村并不远。
  • [赢牛奶] 同合作方沟通了一下午,离开会议室的时候你整个人都瘫在了椅子上,精疲力尽差点被强制关机,觉得只有在李泽言怀里蹭一蹭才能重新充满电 偏偏悦悦顾梦她们
  • 《第三极》作词:王海涛作曲:许巍演唱:许巍何必管一片海,有多澎湃何必管那山岗,它高在什么地方只愿这颗跳动不停的心,永远慈爱好让这世间冰冷的胸膛,如盛开的暖阳旅人
  • 就是说,这就是卖家秀与买家秀吗?深更半夜试着画了一下同款(简笔画)结果突然发现一件很恐怖的事儿,我特喵!
  • #宋亚轩[超话]##宋亚轩十八踔厉风禾尽起##宋亚轩 弦声向阳#哈喽啊我们亲爱的轩轩,今天是你迈向18岁的第一天,不知道感觉如何呢哈哈不管怎么样先祝你18岁生日
  • 自开通运行以来,12328服务中心不断完善知识库信息,建立首问负责制、回访专岗制和重点督办制等制度,保障投诉举报即接即办,第一时间回应群众关切。自开通运行以来,
  • 这期间有很多有趣的事情,记得有个宝贝会为了我们家衣服的一粒扣子和我们“争执”很久,发给我们大量的文献,和历史记录甚至汉文化的大师的聊天记录。只为了让更多的人去了
  • 环境好的医院有哪些?现在宁江已经在改政策了,就是想团团圆圆过个年,防控我支持,麻烦精准落实好吗。
  • 超酷的奶凶小句子❶关你西红柿❷少来探究我❸很酷 不聊天❹很凶 和你不熟❺生活无聊 拔会儿腿毛❻你很好 但是没兴趣认识你❼心情不好 找我就爆炸给你看❽你的脑袋真奇
  • ———————————————————————IECA,一个加拿大本土的留学移民工作室(法语/英语/粤语/国语均可)IVEY➕UBC商界高管最强团队,专注商科及
  • 昨日KS电商销售日榜出炉,业绩普遍不高,榜一陈先生销售额只有2644万,紧随其后的是辛选主播丹丹,她的销售业绩为2247万。离开辛选做自己的安九则以877万的销
  • 斤顾客一天瘦斤 第一天朴塑生酮 还是普通版套餐 来咨询的时候还说目标是一个月瘦斤结果第一天直接干瘦斤 这对大基数来说真的很容易..有时候他们对自己狠狠心饿自己也
  • 以前别人问喜欢什么我可以说喜欢打球喜欢球鞋喜欢音乐现在天天浑浑噩噩说喜欢什么也还是回答之前的老一套但发现这些兴趣已经好久没做过了对什么都无所谓一样以前还自觉是个
  • 常见吉祥植物有1竹竹是高雅脱俗品质的象征,寓意吉祥【竹报平安】【有骨节气】苏东坡曰;”宁可食无肉,不可居无竹。#好运##招财运#常见吉祥植物有1竹竹是高雅脱俗品
  • #潮流生活# 骁龙870手机和骁龙888手机加速清仓,12G高配版本只要2000块钱出头,这对千元机的冲击还是挺大的。 4、恢复期内(一般健康的人,大概需要七
  • 80%的成就取决于20%的行为:基础管理的威力?#手机号码识人# 看财运缘友22岁了容易对基金股票理财没有什么概念的,花的比赚的多的,自己家里也是容易破财的,这
  • ¥5 福利券,快抢-----------------找券神器,自助搜索全网内部优惠券→[话筒]【莫等待】男士加绒超厚保暖裤420g原价29.9RMB起,券后【1