语料清洗,其实就跟保护孩子教育的成长环境是差不过的概念。
教育孩子,必须保护他的成长环境——越是小的时候,就越不能让他接触乱七八糟的东西。
一旦从小长歪了、学坏了,后期再怎么教育、再怎么修理,也很难完全纠正回来。
人工智能模型也一样如此,如果早期的“言心”模型出了问题,那意味着“言心”模型现在所有的备份都会出现同样的问题。
机器学习很难,各种模型各种算法,都是经历数年甚至十数年的演进和发展才逐步完善的。
训练的过程中,更是消耗大量的cpU、GpU算力资源,耗费大量的金钱,可能还不能完全达到预期想要的效果。
但是,机器学习一旦学到了,想要让它“忘掉”——那更是不可能的事情。
在无数个神经网络节点上,机器学习到的东西可以说是无处不在,谁也不知道这些语料的成果会在哪些个节点上有所体现。
现在的技术手段根本没有办法通过递归或遍历确定这些节点——因为就连训练者们自己其实也不清楚AI模型究竟是如何掌握这些能力的。
动不动几十甚至上百个tb的数据,也确实不是人力检测所能企及的——更不用说去指定清除特定的内容和能力了,这根本不可能做得到。
类比人的记忆,其实也差不多,你告诉一个人一个秘密,然后后悔了,想让他忘掉?
那能怎么办?没有任何办法!
就算你对着他的脑袋给一榔头,最终也不一定会是个什么结果——相比单独忘掉这件事儿,让他完全失忆倒是更简单一些。
机器学习的“遗忘”也是如此,但从技术层面来讲,消除特定数据点影响的传统方法,就是重开——也就是从某个备份开始重建系统。
如果所有备份都有问题的话,那就真的只能从零开始了。
而从零开始,那意味着海量的培养成本——几十上百亿的投资啊,直接就打了水漂了。
这样的损失,别说是千寻科技,换成其他任何企业也无法轻易接受。
“也不是完全没有办法。”程旭微微思索了一番,随后慎重的点了点头,微笑着说道。
如果真的是人,除了让他完全失忆,程旭也没有任何办法。
也不知道当今医学界有没有能让人忘掉一些事儿的方法,想来应该是没有的,人脑是最精密最复杂的器官,科学对之的认识还很局限。
但机器说到底并不是人,神经节点网络虽然庞大且复杂,但也并不是真的神经细胞,跟复杂的人类大脑相比,它还差了些。
结合自己曾经的经验,程旭略微以推断,就想到了借助“荷泵”芯片的某些特性和优势,尝试解决这个问题是可行的。
“你有办法?”潘正教授脸色一喜,不过却没有问得更多,而是说道:
“那回头我联系千寻,你们应该有很大的合作空间。千寻科技着急上火好一段时间了,如果你能解决这个问题,不管是对你,还是对千寻来说,都是一件大好事儿!”
程旭原本还在计划着怎么切入人工智能这个领域——虽然“荷泵”优势明显,强势插入也不是不行,但人工智能发展了这么多年,有一个好的切入点,绝对是事半功倍的。
听潘正教授这么说,程旭表示同意:“我需要先看看具体情况,老师有内测系统的权限吧?加我一个,回去我先研究一下。”
“嗯……”
……
“行了,别聊了,过来吃饭吧。”
俩人越说越投机,不知不觉,天色都已经很晚了,方雅蓉特意亲自准备了饭菜,表现出了十足的重视。
她早就看出,老公对程旭这个学生的态度已经超出了一般的师生关系,而且,这年轻人也是真的有点儿意思,她也挺喜欢的。
“小旭,今天陪我喝点儿?”
潘正也是兴致大起,仿佛回到了年轻时候一样,浑身充满了劲儿,也没给程旭推脱的机会。
程旭一般不喝酒,但酒量还行——他曾经想试试自己能喝多少来着,但没试出来,五十三度搞了一瓶,最后算是有点儿晕乎吧,想来酒量应该不差。
今天也就是小酌一杯,没有任何问题。
他是没问题,不过潘正教授看起来酒量可真的不太行,一杯酒下肚,话就开始多了起来:“小旭啊,跟你说句交心的话,你今天莽撞了。”
“啊?”程旭有点懵。
潘正其实没喝多,他说的什么他自己清楚的很,他就是故意的——在某些方面,他的确有他的担心——因为他想起了曾经的自己。
方雅蓉也早早的就离席了,这是她的习惯——她习惯在需要的时候给老公留空间。
“不用多问,你就记住,你今天没去过学校实验室,也没用过学校实验室的任何设备。”
潘正突然严肃起来,而且说得那么谨慎,程旭好似想到了什么,神色也变得有些凝重:
“学校的设备?这有什么关系吗?无非是做了一个验证实验而已,不至于出什么幺蛾子吧?”
“理论上是不会,但是你这个成果,说实话,太大了。尽可能的别跟更多的人扯上关系,稍微有一点儿,未来都是麻烦。
“不是我小人之心,但防人之心真的不可无。你今天做的就不好,跟我说得太多了。你知道最后的结果出来的时候我想什么了吗?
“我在想啊,如果这东西是我的,我增选院士都够资格了。你知道,这种诱惑有多大吗?你这种行为真的很莽撞……”
……
就这样,在酒桌上,潘正教授给程旭上了第一课:要永远保持谨慎,尤其是对于革命性的成果,再大的谨慎都是不为过的。
原本的程旭,包括前世在内,对潘正教授的了解认知都限他是极为正直,正直到没朋友的那种人,但却鲜有人知道原因。
不过现在程旭知道了——潘正教授在拿他曾经的血一般的教训来告诫程旭——谨慎,还是谨慎。
说起曾经的往事,潘正教授内心已经非常平静,但藏在心里的委屈程旭看得出来。
“其实那次确实是整个团队的成果,谁功劳大一些、小一些都是小问题,纵然主要工作是我做的,但不都是报效祖国吗,有什么可争的呢?
“但万万没想到,竟然有人拿着这个成果申请了技术移民,而成果,也就这样,跟着丢了。
“那个时候,我才明白,报效祖国不是报效领导,不是谁都能代表祖国的,这个时候,你心里要有杆秤!”
程旭微微有些动容,潘正教授的这种委屈,不是因为成果被抢,而是成果流失了——本属于我们自己的东西,最终却流向了国外,成为了攻击我们自己的武器!
这怎么能不让人痛心疾首?