编辑:静音 好困
【新智元导读】NeurIPS 2024高中生论文录用结果公布!论文接受率仅为6.4%,3名国内学生杀出重围,斩获Spotlight。就在刚刚,NeurIPS 2024首届高中论文录用结果公布了!
今年,NeurIPS 2024首次设置了「高中生赛道」,直接将「学好AI要从娃娃抓起」变成了现实。
此举曾在今年4月引发激烈的讨论,有人认为这为有科研潜力的高中生提供了宝贵机会,也有人担心它会进一步加剧教育资源的不平等。甚至有网友戏称,这是「代练家长」的战场,研究生和博士们可能也会被拉下水。
总之,此次大会邀请高中生提交关于「机器学习对社会影响」的研究论文。部分决赛入围者将获得在线展示项目的机会,并将在NeurIPS官网上重点展示他们的研究成果。此外,获奖项目的第一作者将被邀请参加在温哥华举行的NeurIPS 2024颁奖典礼。
研究应用领域包括但不限于以下方面:农业、气候变化、教育、医疗保健、无家可归问题、饥饿、粮食安全、心理健康、贫困、水质。
值得注意的是,每份提交作品必须由高中生作者独立完成。
最终,大会共收到了全球高中生提交的330个项目。
其中,有21篇被选为Spotlight,4篇为获奖论文,接受率6.4%。
值得注意的是,总共约有13位华人学生入选,其中3名国内学生的论文获得Spotlight!
他们分别是来自上海星河湾双语学校的Tianrui Chen、人民大学附属中学的Alan Wu、北京师范大学附属实验中学的Yuhuan Fan。
获奖项目
1. ALLocate: A Low-Cost Automatic Artificial Intelligence System for the Real-Time Localization and Classification of Acute Myeloid Leukemia in Bone Marrow Smears作者:Ethan Yan
学校:Groton School(美国)
(ALLocate:一种低成本自动化AI系统,用于骨髓涂片中急性髓性白血病的实时定位和分类)
当前临床实践中,准确检测白血病仍面临成本高、耗时长及医疗经验不足等挑战。为解决这一问题,该研究开发了首个用于实时定位和分类骨髓涂片中急性髓系白血病的低成本集成自动人工智能系统——ALLocate。
该系统由自动显微镜扫描系统和图像采样系统组成,并配有基于深度学习的定位和分类系统。研究开发了一种基于卷积神经网络(CNN)的区域分类器,用于从血液和血块区域中筛选可用区域。为了实现实时检测,开发并优化了YOLOv8模型。这些模型表现出高性能,区域分类器的准确率达到96%,YOLOv8的mAP为91%。
此外,研究还使用3D打印组件开发了一种低成本自动显微镜扫描仪系统,该系统由步进电机驱动,并通过基于Arduino的RAMPS控制板进行编程控制。将ALLocate应用于骨髓涂片时,其白血病检测结果与医生的结果相似,但速度明显更快。
这是首次将深度学习系统与低成本显微镜扫描系统集成应用于高性能白血病检测的报告,可惠及小型社区诊所和资源匮乏地区的诊所,从而使医疗服务更加普惠且经济可行。
2. Image Classification on Satellite Imagery For Sustainable Rainwater Harvesting Placement in Indigenous Communities of Northern Tanzania作者:Roshan Taneja,Yuvraj Taneja
学校:Sacred Heart Preparatory(美国)
(利用卫星图像分类技术在坦桑尼亚北部土著社区进行雨水可持续收集系统选址)
在坦桑尼亚北部偏远地区,马赛部落的妇女和儿童每天需要步行九小时去取水。通过与马赛社区长达四年的合作努力,已安装了多个雨水收集装置,为超过4000人提供了教育机会和经济发展的条件,从而改善了当地的社会经济状况。
本项目采用了一种创新方法,将卫星数据与图像分类相结合,用于识别以独特形状的马赛房屋为标志的人口密集区域。它还将利用密度地图规划最佳的雨水收集装置位置,目标是帮助3万名马赛族人。
该项目的核心是开发了一个图像分类模型,该模型基于1万张手工挑选的 Bomas(马赛居住单位)的卫星图像样本进行训练。通过此模型生成的密度热力图,可以在最关键的位置战略性地放置雨水收集装置,从而最大化其影响。该项目突显了卫星技术与机器学习在解决人道主义需求(如水资源问题)方面的潜力,尤其是在难以建设基础设施的偏远地区。
3. Multimodal Representation Learning using Adaptive Graph Construction作者:Weichen Huang
学校:St. Andrew’s College(爱尔兰)
(基于自适应图构建的多模态表征学习)
多模态对比学习通过利用图像和文本等异构数据源来训练神经网络。然而,许多当前的多模态学习架构无法泛化到任意数量的模态,并且需要手动构建。
该项目提出了一种新颖的对比学习框架AutoBIND,可以通过图优化从任意数量的模态中学习表示。
研究在阿尔茨海默病检测中评估了AutoBIND,因为它具有现实世界的医学应用价值,并且包含广泛的数据模态。实验结果表明,AutoBIND在这一任务上优于以往的方法,凸显了该方法的泛化能力。
4. PumaGuard: AI-enabled targeted puma mitigation作者:Aditya Viswanathan,Adis Bock,Zoe Bent,Tate Plohr,Suchir Jha,Celia Pesiri,Sebastian Koglin,Phoebe Reid
学校:Los Alamos High School(美国)
(PumaGuard:基于AI的美洲狮精准防治系统)
该项目训练了一个机器学习分类算法,以检测野外摄像机图像中的美洲狮。这个算法将成为一种专用防范工具的一部分,以阻止美洲狮攻击当地马厩的牲畜。该模型使用Xception算法,训练准确率达99%,验证准确率为91%,并成功识别出马厩附近的美洲狮。
Spotlight项目
1. Predicting Neurodevelopmental Disorders in rs-fMRI via Graph-in-Graph Neural Networks作者:Yuhuan Fan
学校:The Experimental High School Attached to Beijing Normal University(北京师范大学附属实验中学)
(基于嵌套图神经网络在静息态功能磁共振成像中预测神经发育障碍)
2. GeoAgent: Precise Worldwide Multimedia Geolocation with Large Multimodal Models作者:Tianrui Chen(陈天睿)
学校:Shanghai Starriver Bilingual School(上海星河湾双语学校)
(GeoAgent:基于大规模多模态模型的全球多媒体精确地理定位)
值得一提的是,陈天睿同学还参加了今年8月举办的第一届国际人工智能奥林匹克(IOAI)。
参赛成员来自全球的34个国家与地区,共44支队伍。其中,陈天睿作为乾队队长,带领团队斩获2枚银牌。另外,坤队也获得了1枚银牌。
3. Vision-Braille: An End-to-End Tool for Chinese Braille Image-to-Text Translation作者:Alan Wu(吴悠)
学校:The High School Affiliated to Renmin University of China(中国人民大学附属中学)
(Vision-Braille:面向中文盲文图像到文本转译的端到端工具)
论文地址:https://arxiv.org/abs/2407.06048
结合盲文识别算法,该项目开发了首个公开可用的盲文翻译系统。
由于缺乏高度准确的盲文翻译系统,视障群体的盲文作业或考试试卷常常无法被普通教师理解,特别是中文盲文还包含声调标记。为了节省空间,盲文书写者常常省略声调标记,这导致在将具有相同声母和韵母的盲文翻译成中文时容易产生混淆。以往的算法在提取上下文信息方面存在不足,导致盲文翻译成中文的准确率较低。
该项目创新性地对mT5模型进行了信息化微调,采用了编码器-解码器架构,用于实现盲文到汉字的转换。本研究基于Leipzig Corpora创建了盲文与相应中文文本的训练数据集。
通过课程学习的微调方法,本项目显著减少了盲文中的混淆问题,在验证集和测试集上分别达到了62.4和62.3的BLEU分数。
这一系统将为备战中国高考的视障学生及其家庭带来帮助,为他们实现大学梦想提供助力,并推动教育公平的发展。
项目地址:https://vision-braille.com/
北京大学计算机学院的张铭教授在今年9月也分享了吴悠同学的入围消息,并对她表示了祝贺。据张铭教授介绍,吴悠在2022年高一加入她的课题组时,就提出了这个项目的想法。
4. Diagnosing Tuberculosis Through Digital Biomarkers Derived From Recorded Coughs作者:Sherry Dong
学校:Skyline High School(美国)
5. INAVI: Indoor Navigation Assistance for the Visually Impaired作者:Krishna Jaganathan
学校:Waubonsie Valley High School(美国)
6. Implementing AI-driven Techniques for Monitoring Bee activities in Hives作者:Tahmine Dehghanmnashadi
学校:Shahed Afshar High School for Girls(伊朗)
7. AquaSent-TMMAE: A Self-Supervised Learning Method for Water Quality Monitoring作者:Cara Lee, Andrew Kan,Christopher Kan
学校:Woodside Priory School(美国),Weston High School(美国),Noble and Greenough School(美国)
8. AAVENUE: Detecting LLM Biases on NLU Tasks in AAVE via a Novel Benchmark作者:Abhay Gupta,Philip Meng,Ece Yurtseven
学校:John Jay Senior High School(美国),Phillips Academy(美国),Robert College(土耳其)
9. FireBrake: Optimal Firebreak Placements for Active Fires using Deep Reinforcement Learning作者:Aadi Kenchammana
学校:Saint Francis High School(美国)
10. Advancing Diabetic Retinopathy Diagnosis: A Deep Learning Approach using Vision Transformer Models作者:Rhea Shah
学校:Illinos Mathematics & Science Academy(美国)
11. LocalClimaX: Increasing Regional Accuracy in Transformer-Based Mid-Range Weather Forecasts作者:Roi Mahns,Ayla Mahns
学校:Antilles High School(美国)
12. HypeFL: A Novel Blockchain-Based Architecture for a Fully-Connected Autonomous Vehicle System using Federated Learning and Cooperative Perception作者:Mihika A. Dusad,Aryaman Khanna
学校:Thomas Jefferson High School for Science and Technology(美国)
13. Robustness Evaluation for Optical Diffraction Tomography作者:Warren M. Xie
学校:Singapore American School(新加坡)
14. Translating What You See To What You Do: Multimodal Behavioral Analysis for Individuals with ASD作者:Emily Yu
学校:Pittsford Mendon High School(美国)
15. SignSpeak: Open-Source Time Series Classification for ASL Translation作者:Aditya Makkar,Divya Makkar,Aarav Patel
学校:Turner Fenton Secondary School(加拿大)
16. SeeSay: An Assistive Device for the Visually Impaired Using Retrieval Augmented Generation作者:Melody Yu
学校:Sage Hill School(美国)
17. Realistic B-mode Ultrasound Image Generation from Color Flow Doppler using Deep Learning Image-to-Image Translation作者:Sarthak Jain
学校:Silver Creek High School(美国)