转载:ChatGPT 背后的“功臣”——RLHF 技术详解

https://huggingface.co/blog/rlhf 本文也提供英文版本 English。 OpenAI 推出的 ChatGPT 对话模型掀起了新的 AI 热潮,它面对多种多样的问题对答如流,似乎已经打破了机器和人的边界。这一工作的背后是大型语言模型 (Large Language Model,LLM) 生成领域的新训练范式:RLHF (Reinforcement Learn ... 阅读更多

复电导率的推导

利用脈衝雷射蒸鍍法製備碲化鉍薄膜與兆赫波時域頻譜之研究

转载:关于时钟佯谬(卢昌海)

一. 时钟佯谬简史 在相对论的历史上, 曾出现过一些流传很广的佯谬——也可以说是意外。 之所以说是意外, 是因为一些知名物理学家也参与了某些话题的讨论, 给出的答案却不尽相同, 从而使被讨论的话题变得更像佯谬。 时钟佯谬 (clock paradox) 就是其中最著名的一个。 时钟佯谬源于一个很简单的问题: 在惯性参照系中有两个彼此校准了的时钟, 一个保持静止, 另一个沿闭合路线运动后回到原地, ... 阅读更多

光刻机镜头是如何加工的?

     网络上有很多文章说德国蔡司公司用德国ALZMETALL(奥美特公司)GS-1400重型精密立式五轴摇篮机床把EUV光刻机镜头直接加工到20皮米的表面粗糙度,风闻最近也有帖子提到。我对此感到怀疑,查证了一下,我认为这是一个误传,于是就有了这篇帖子。        蔡司公司加工光刻机镜头确实要用到精密机床铣磨,但后续还要经过小磨头抛光、磁流变抛光和离子 ... 阅读更多

会议纪要丨ASML光刻机专家交流纪要!

2023年3月31日 核心信息: 逻辑电路高制程一般只是底部第一层、第二层对精度要求高,上层电路精度要求不高,落后光刻机也可以做,fab 厂是各种型号设备组合使用的。 焦深是焦点上下 10%范围可以得到合格成像质量,大焦深可以得到更大工艺窗口,焦深与光刻胶的厚度、晶圆的平整度、基台的误差等都是相关的,无法通过软件改变,只能从工艺上做调整。光源、透镜、图形密集度都会影响焦深。 Gigaphoton ... 阅读更多

光刻工艺相关文章

先进光刻技术的发展历程与最新进展 李艳丽 如何看待长春光机所 EUV 光刻机进展? 7nm 制程工艺如何实现? 会议纪要丨ASML光刻机专家交流纪要! 2021年 卡脖子系列——全球光刻机行业概览 【兆恒机械】光刻机详解——半导体工业界最为耀眼的明珠 深紫外光刻复杂照明光学系统设计 一种高na投影物镜 投影光刻物镜像质补偿策略与补偿技术研究_赵磊 高数值孔径投影光刻物镜的光学设计_徐明飞 纳米集成 ... 阅读更多

Chatgpt相关开源库

Colossal-AI PaLM-rlhf-pytorch b站UP 何小枝天天向上: 前一个小节(ChatGPT是怎样被训练出来的?):https://www.bilibili.com/video/BV1BG4y137SH视频中的源码:https://github.com/HarderThenHarder/transformers_tasks/tree/main/RLHFReward Model ... 阅读更多

独立人工智能开发者开源自己的ChatGPT训练算法实现

人工智能研究小组LAION和 CarperAI分别发布了OpenAssistant与trlX,这些均是人类反馈强化学习 (RLHF) 的开源产品实现,用于训练ChatGPT的算法。此外,独立人工智能开发者Phil Wang也开源了自己的ChatGPT算法实现。 关于 LAION,全称为 Large-scale Artificial Intelligence Open Network,是一 ... 阅读更多

打破传统GAN方法痛点!牛津大学提出轻量级的生成对抗模型

论文链接:https://arxiv.org/abs/2209.03793 写在前面 传统卷积受限于固定的几何结构,无法高效捕获空间与通道的远程依赖。本文提出的方法不仅拥有可调整的动态感受野,而且突出了像素之间的负关系。另外本文针对传统生成对抗网络,设计了一种新的生成策略,进一步稳定和加快了训练过程。 生成对抗网络(GAN)预热 本文方法致力于从高维数据分布中生成现实多样的样本,在正式步入主题之前 ... 阅读更多

独立人工智能开发者开源自己的ChatGPT训练算法实现

人工智能研究小组LAION和 CarperAI分别发布了OpenAssistant与trlX,这些均是人类反馈强化学习 (RLHF) 的开源产品实现,用于训练ChatGPT的算法。此外,独立人工智能开发者Phil Wang也开源了自己的ChatGPT算法实现。 关于 LAION,全称为 Large-scale Artificial Intelligence Open Network,是一 ... 阅读更多

【部署教程】基于GPT2训练了一个傻狗机器人 - By ChatGPT 技术学习

作者:小傅哥博客:bugstack.cn 沉淀、分享、成长,让自己和他人都能有所收获! 首先我想告诉你,从事编程开发这一行,要学会的是学习的方式方法。方向对了,才能事半功倍。而我认为最快且行之有效的技术技能学习,就是上手实践。先不要搞太多的理论,买回来的自行车不能上来就拆,得先想办法骑起来。 所以小傅哥就是这样,学东西嘛。以目标为驱动,搭建可运行测试的最小单元版本。因为康威定律说;问题越小,越容易 ... 阅读更多

轻量版ChatGPT训练方法开源!仅用3天围绕LLaMA打造,号称训练速度比OpenAI快15倍

你拿到LLaMA的代码了吗?觉得这个训练方法如何? 基于Meta模型打造的轻量版ChatGPT,这就来啦? Meta宣布推出LLaMA才三天,业界就出现了把它打造成ChatGPT的开源训练方法,号称比ChatGPT训练速度最高快15倍。 LLaMA是Meta推出的超快超小型GPT-3,参数量只有后者的10%,只需要单张GPU就能运行。 把它变成ChatGPT的方法名叫ChatLLaMA,基于RLH ... 阅读更多

调研国产半导体制造——中芯国际

背景 中芯国际在北京、上海、天津、深圳分布有十座工厂: 工厂 地点 晶圆尺寸 制程 中芯上海 上海 8英寸x112英寸x1 0.35um-90nm14nm及以下(曾经) 中芯南方 上海 12英寸 14nm及以下(曾经) 中芯北京 北京 12英寸 0.18um-55nm 中芯北方 北京 12英寸 65nm-24nm 中芯天津 天津 8英寸 0.35um-90nm 中芯深圳 深圳 8英寸 0.35um ... 阅读更多