在某欧洲知名大模型公司创始人的团队实习,清晰地看到 AI 的趋势是用更多数据训练更大的模型。实习结束后,我回到实验室继续科研工作,然而受制于学术界实验室的资源,我没能做最前沿、最感兴趣的课题。原本打算读一个校企联培的博士,获得更多计算资源。 一次偶然的机会,猎头和HR通过一篇论文致谢找到了我,邀请我参加 MiniMax 的面试。我跟技术团队的同学聊了聊, **发现在这里工作的都是聪明、有经验的 AI 科学家,没有办公...
RNN模型(循环神经网络)是典型的NLP模型架构,基于RNN还有其他一些变种模型(忽略其名字,Transformer出来后,已经不再重要了),但是都存在相同的问题,并没能很好解决。**RNN的基本原理**是,从左到右浏览每个单词向量(比如说`this is a dog`),保留每个单词的数据,后面的每个单词,都依赖于前面的单词。**RNN的关键问题**:前后需要顺序、依次计算。**可以想象一下,一本书、一篇文章,里面是有大量单词的**,而又因为顺序依赖性,不能并行...
广告文案、科技论文摘要等,这些应用可以通过对文本内容的分析和理解,自动生成符合语法和语义规则的文本内容。智能问答系统:例如智能客服、在线教育等,这些应用可以通过对问题的理解和分析,自动回答用户的问题。社交媒体分析:例如情感分析、主题分类等,这些应用可以通过对社交媒体文本内容的分析和理解,提取出其中的情感、主题等信息,帮助企业了解用户的反馈和情感倾向。此外还有一些行业大模型的应用场景,比如,法律大模...