openai 新出的解释大模型神经元作用的文章: Language models can explain neurons in language models

1、 解释的是 gpt-2 XL 1.5B的模型的神经元的作用
2、 文章的说的神经元是 MLP 结构中的隐层,即 feed forward 结构的 隐层,隐层神经元一般是 d_model 维度的四倍。 所以一共有 0-37 层的 0-6399 个神经元
3、 文章中的 activations 是神经元激活之后那一层的 文本/embedding, 每个词的颜色深浅是(0-10)是代表隐层研究的那个神经元到此 token 的 权重
4、 研究方式:
1)通过训练和推演过程的产生的大量状态提炼出每个神经元和大量在其激活状态下对应的 activations 文本数据库
2)借助 GPT-4 把这些文本例子做 prompt 工程输入,让其"总结"生成一个 "解释" 文本来解释此神经元的作用(借助了GPT4)
3)与上面反向的,让GPT4在上一步假设的 "原因" 下,给 activations 重新打上权重 "深浅不一的绿色"(借助了GPT4)
4) 比较原始 activations 和新的模拟生成的 activations,当然 2 个 activations 文字一模一样的,只是 "绿色" 权重不易。 比较两者相似的,作为那个 "解释" 文本准确度的得分

5、图一:方法步骤,图中研究14层-3822号神经元,根据绿色权重,GPT4猜测这个神经元作用是激活 x by x 或 x after x 这样的结构语法
6、图二:列出了一个 activations 同一个单词,不同层下神经元激活的 "原因", 由GPT4猜测的“解释”和自动聚类
7、图三:neuron-viewer 工具查看 30层第28号神经作用是 “意识到这是个时间字串”, 下面的 activations 例子中,时间字串的确被加重绿色“激活”了
8、链接:可交互的论文地址 和 可交互的 neuron-viewer 在评论

9、 其他随想:
1)gpt 模型 75 % 参数在 MLP 类似结构,所以MLP的神经元大有作用;
2)一个神经元可 weight 注意多个activations 中的 token,是因为 attention 机制的强大编码能力,类似傅里叶变换频域的元素是“函数”,每个单词编码是 “其他所有单词为基的函数”。 是高一阶的编码方式,这种高一阶的方法是 transformer 和 rnn 方法的本质不同。
3)如图1,浅层神经元关注到了 “以K开头的字串”这样的简单意思,深层神经元关注到了“食品相关的”深层语义。 (和卷积神经网络解释相通)
4)openai 在秀自家 gpt4 和prompt工程帮助科研的能力

在心情最糟糕的时候,仍会按时吃饭,早睡早起,自律如昔。-—这样的人才是能扛事的人。人事再乱,打不乱你心。人,不需要有那么多过人之处,能扛事就是才华横溢。

In the worst of times, I eat at the same time, go to bed early, get up early, and be disciplined as ever. -- Such people are able to carry the load. Personnel again chaos, play not chaos your heart. People, do not need to have so many exceptional, can carry things is talented.

#GTOP[超话]#
➽SIDE G

20230510 | via voguetaiwan IG

[#VogueFashionNow 久違被媒體包圍的志龍,弱小、無助、我是誰我在哪?

現在幾乎只為 @ chanelofficial 露臉的G-Dragon,特別出席剛在洛杉磯舉辦的Chanel Cruise 2023/24度假大秀。穿著全身佈滿白色山茶花的黑色夾克,被媒體團團包圍的他,手足無措的樣子實在太可愛,誰能相信眼前這位是超級巨星!

G-Dragon受訪提到,他最喜歡Chanel秀上閃亮多彩的dancing shoes。還沒看秀的你,記得鎖定台灣晚間10點的Chanel大秀影片。]

▶G-DRAGON - ‘Can't Help Falling in Love’ (TCB ⚡️) WB传送门:https://t.cn/A6ajV6Eo

#权志龙chanel全球形象大使#
#香奈儿早春度假系列#

情报:大可 https://t.cn/A6NEp9Cv


发布     👍 0 举报 写留言 🖊   
✋热门推荐
  • 一个电话,沂蒙救援队就会无私奉献和帮助。一个电话,沂蒙救援队就会无私奉献和帮助。
  • 但他也提到,在实际的工作中,更常采用的方法是以有序配位壳层的数量来定义空间有序性,这是考虑到不同材料之间由于键长等差异导致的空间尺寸差异。其发现不仅使研究者深入
  • 祝宝贝生日快乐呀,祝你平安喜乐,永远幸福,越来越好[爱你]@袁冰妍我是希望你,也尊重你,也会帮助你,尽可能的把你自己的人生活成你想要的样子。你的人生不需要完成谁
  • 我们是怎么开始交往的,我自己也很清楚,这个时候要求别人对我感情深厚,我才是有病吧。有人说,很爱你的人就不会觉得累了啊,这些对他而言是自然而然的事。
  • 17.你永远也不知道爱你的人为你胡思乱想的时候有多难受。11.你永远也看不到我最寂寞的样子,因为只有你不在我身边的时候,我才最寂寞。
  • 人不应该压抑自己的爱与牵挂,真正的贱人是皇帝啊!即使在现实生活中,我喜欢的异性也是这些人,他们不会强调自己的这部分,因为他们不知道,但是我能嗅出来。
  • 感叹人生,是因为曾经没有过轰轰烈烈的壮举,觉得渺小,觉得平庸,似乎生活过于简单,简单得让人感觉烦躁。没有大言不惭地说过将来,只是比较现实地握住了现在,我想,这是
  •   3.让自己有后路,比如你去面试,如果你已经裸辞,你很想要这个职位,自然会紧张,但是你就算面试失败还有现在的工作可以继续做,那就不会那么紧张了;我的经历告诉我
  • 那些用几千条中国人命做实验的恶魔,就这样堂而皇之的成了美国的教授、研究员,可见美国骨子里是什么货色。这就是所谓的“美国效率”反正美国资本家用印刷的美元挣钱。
  • 学会正确的自律,不消耗自己,管理好自己,才是对自己最好的善待。学会正确的自律,不消耗自己,管理好自己,才是对自己最好的善待。
  • 然后配图是一张自己和何炅的背影合照,不得不说看到这个消息的时候,哪怕不是快乐家族的粉丝也让人忍不住觉得可惜又期待。在快乐家族解散之后,他们就几乎没有合体过,有公
  • 毕竟年轻的时候洪金宝也是帅哥一枚,更不要说妻子的美丽了,所以对自己的这个女儿,洪金宝也是表示是“全世界第一漂亮”。如今的洪煦榆已经36岁了,但还是没有结婚,洪金
  • 因为当时的北京是天子脚下皇城根儿,全国各地的人汇聚于此,也带来了各地的曲艺和小调。因此也有不少研究者认为,此曲调是通过大运河由北方传入南方的。
  • ][蜡烛]最适合末法众生改命的一部经典,有时福报不够财神来了都帮不了,而此部经典可以读诵此经,传播此经,对人解说,所有业障消除,可见此经是古代皇家之密中密,一般
  • #数码博主# 【小米版空调安装图,外形出众性价比值得期待】小米这款空调是采用变频设计,名字叫做智米,采用白色的配色;空[拜拜]调颜值十分出众,外形科技范十足,并
  • 这周有很多暖心的瞬间……让我深刻感受到「因·果」曾伸出的援手,释放的善意,坚持的相信都会成为一个个生活的礼物来到我身边虽然不可抗力导致行程乱掉,但是大家对我的关
  • 看来我之前遇到的人都有非常好的社交自觉症了,只是我没想到真的会有这种你已经非常客气地提醒过她,她还不自觉的人。我终于懂工作后的身边朋友老是向我吐槽她们的同事是什
  • 运气靠策划~我承认,就像人不能没有金钱一样,人不能没有运气。如果你犹豫了,你可能会与这段感情永远地擦肩而过。
  • 要知道,《非诚勿扰》虽然崇尚自由,可是无论男女嘉宾,他们都是各行各业的佼佼者,就算没有自己的工作,也会被冠以“艺术家”的称号。所以虽然很多人都说这个节目是骗人的
  • #辽商# 8月20日,辽商总会名誉会长、万达集团董事长王健林一行访问一汽,双方进行座谈交流并签署战略合作协议,携手打造汽车服务生态、共创美好生活。#辽商# 日前