世界一直在变,但有些事却是永恒不变的,例如参加黑客松做 scrum 开发的热血,还有终於找到解决方法,看到一线曙光的那股兴奋,永远都会带出开发者、工程师的成就感。NVIDIA 为了推广 GPU 的好,在今年仍然不畏疫情,在线上举办了连续 5 天的黑客松,广邀台湾开发者一起来挑战。
NVIDIA TWCC GPU Hackathon 与国研院国网中心、台湾智慧云端服务携手协办活动,专为开发者、研究人员设计一个连续 5 天的活动,协助开发团队透过 GPU 找到加速程式码的新方法。
因此,过往只知道使用 CPU 或是传统资料分析模式的开发团队,非常有可能在 5 天之内就可以上手 GPU,并且找到适合自身团队的开发效率全新解决方案。这场活动特别提供 TWCC 台湾 AI 云运算资源供参赛者使用,甚至 NVIDIA 还会出动专家讲师,特别针对 GPU 与技术工具做使用指导。
没看过哪场黑客松,还是主办方亲自邀请团队来体验的
为了向开发者推广这超好用的工具,NVIDIA 这一次举办黑客松不只是开放报名,还会亲自上门邀请团队参加黑客松,其中的大功臣就是 NVIDIA 资深解决方案架构师赖柏均。他表示,希望透过实际应用,让学界与产业更了解 GPU 的应用可能及发展潜力,进而让更多产学界夥伴拥抱这实用的工具。
为了找寻适合的团队,赖柏均多管齐下,除了透过先前的团队介绍,更在各式研讨会、业界活动中寻找潜在需求者,邀请他们来体验看看:透过 GPU 将工作内容全面升级,究竟是种什麽样的感觉?
这一次 NVIDIA 也特别邀请两组参与黑客松的团队,亲自分享专案开发过程,以及 Before and After 成果!
智慧制造的关键项目,产线智慧排程如何优化?
由林群惟博士、苏粲程博士所带领的团队「AI Scheduler」,首度参与本届黑客松,就透过 GPU 加速找到未来商品优化的方向。
因应弹性制造与生产时代来临,台湾高科技制造业、生技产业等都面临要快速排程生产的挑战。这时候透过数位工具来做智慧排程处理,可以有效提升效率与客户满意度。
AI Scheduler 团队成员来自工研院巨量资讯科技中心,8、9 年来钻研机器学习等 AI 领域,开发了许多像是机台故障率预诊断、线上品质预测等等实用工具软体,协助第一线生产者掌握生产流程。不过,在拓展「智慧排程」领域时,也遭遇到了产品技术升级的挑战。
在过去,排程靠的主要是人脑,一切原则都奠基於经验法则与直观判断,在小场景中其实还算实用;可若是生产规模扩大或是参数变多,那人脑可就不如电脑了。团队主要客户多半来自高科技光电半导体、基础工业钢铁产业、制药生技医材产业等等领域,这些产业目前在生产与制造上,更面临了需要弹性生产、快速换线与市场客户需求快速变化的挑战。
因此,智慧排程帮助生产顺畅,变成为拿下订单的重中之重。
团队会以蒙地卡罗树搜寻(MCTS)等方法去协助寻找最佳解,透过优化搜寻,以及系统本身的学习机制,达到智慧排程的目标;在黑客松中,团队想做的,则是挑战既有限制、全面加速整体排程效率。
对此,黑客松的 Mentor 在协助导入 GPU 外,还提供了不少好用的工具,比如「Nsight」,不仅能让团队更快找到资料处理的问题症结,更能大幅提升资料可视化程度。
透过 GPU 强化,整体排程效率提升了 11.3 倍
以团队此次在黑客松尝试的 MCTS 应用来说,将模拟放到 GPU 後,整体运算时间竟然整整提升了 11.3 倍!假设一个工厂要做 5000 张订单排程,过去用 CPU 排程,可能得花到 6 个小时;但透过 GPU,只需要不到 30 分钟,出去喝个下午茶就搞定了!
关於这次黑客松中所获得的成果,苏粲程和黄浩哲表示,目前已验证了技术可行性,期待未来能进一步将 GPU 放到商品化版本之中,协助加速 MCTS 的运算,藉此打造更方便快速的通用版排程软体,供一般中小企业使用。
此外,在与黑客松 Mentor 互动的过程中,团队同时也验证自身的技术实力,发现过去偶尔卡关,原来不是因为自己功力不足,只是尚未找到对的帮手而已,也是一项意外的收获。
GPU 加速深化台湾地球科学研究成果,提升全球学术圈重要性
谭老师团队照片,谭谔(图中)带领团队参与本次 NVIDIA 黑客松,找到地质研究的运算新方法。(图片:谭谔团队提供)
工业应用之外,GPU 的运算效能还能应用在基础科学研究产业中,特别是那些包含巨量数据的科学研究领域。
谭谔博士所带领的团队「IES-Geodynamics」来自中研院地球研究所,而主要研究的对象,便是我们脚下的土地。台湾地处板块交界带,是世界上板块活动最活跃的地方之一,不仅地层活动的频率和速度特别快,也是地震带上经济发展较佳的国家,可谓是全球地震研究的重要据点。
然而,地层活动的时间尺度动辄成千上万年,可不是能在实验室中轻易复制的等级,於是乎,许多研究其实都需要利用大量数据去进行计算。举例来说,研究团队需要输入石头的各种物质参数,去模拟像是南中国海过去发生的海盆张裂、台湾西南部平原区及泥岩区的变形、吕宋岛弧跟东亚大陆边缘碰撞形成台湾岛的过程等等。
地质研究通常是以千万年为单位,因此处理的数据也相对大量,需要足够运算能力才能有效率地分析。(图片:谭谔团队提供)
台湾的观测站很多、收到的数据很多,研究需要进行的计算更是超、级、多,可分析时常常面临人力和机器不足的难题,其实很难梳理所有资料。同时,研究团队的动力模式程式需要不断修改,且团队常有新血加入,研究程式必需「好上手」、「易维护」,最重要的,还要「跑得快」,那麽,要怎样才够快呢?
地科巨量资料处理,GPU 加速了 13.6 倍
在过去,团队会尝试减少计算量与计算步骤,设计出适用 CPU 的方式去跑资料;但在黑客松 Mentor 的协助下,团队找到了正确的资料输入方式,可以透过 GPU 去运算步骤繁多的数据。谭谔也分享道,NVIDIA 的 GPU 提供警告讯息的方式十分仔细,对於未来修改内容、最佳化程式都会很有帮助。
在本次参与黑客松时,谭谔尝试将过去与德州大学 Luc Lavier、曼菲斯大学 Eunseo Choi 等人共同开发的模型,交由GPU计算。经由博士生徐志煌及其他学生的努力,目前,该模型已有 80% 可在 GPU 上执行,速度提升了 13.6 倍。
计算速度大幅增加,究竟带来了哪些好处呢?等待时间减少、研究模型拥有更高的解析度,不只如此,研究范围也因此更加广泛,因为在运算时较不会受到边界影响。
黑客松结束後,团队会继续钻研那剩下的 20%,期待可以透过 GPU 的助力,跑出更多更高解析度的模型,去深入了解我们脚下踩的这片土地,并找出地层活动与非断层变形的真正原因,为板块研究领域带来重要成果。
首图来源:Shutterstock