深度学习领域的Empirical Study
An Empirical Study on TensorFlow Program Bugs (ISSTA’18) [PDF]
内容:探究使用TensorFlow框架的程序中bug产生的原因、检测bug的挑战、用户如何应对检测bug的挑战、定位bug的挑战、用户如何应对定位bug的挑战。
方法:挖掘Stack Overflow和github中的数据。
A Comprehensive Study on Deep Learning Bug Characteristics (ESEC/FSE’19)[PDF]
内容:探究使用5种流行的深度学习框架会遇到的bug类型、根本原因、产生的影响、Bug出现的阶段、共性以及bug的演变。
方法:挖掘Stack Overflow和github中的数据。
An Empirical Study on Program Failures of Deep Learning Jobs (ICSE’20 Distinguished Paper Award) [PDF]
内容:深度学习任务failure的种类、根本原因和现有测试/诊断方法。
方法:通过研究微软集群中实际遇到的fault,并对6位微软的开发者进行访问。
Taxonomy of Real Faults in Deep Learning Systems (ICSE’20) [PDF]
内容:探究在使用深度学习系统中会遇到的错误。
方法:挖掘Stack Overflow和github中的数据,并通过20位科研工作者/从业人员进行label。
Repairing Deep Neural Networks: Fix Patterns and Challenges (ICSE’20) [PDF]
内容:探究在深度神经网络中中bug的fix pattern和挑战。
方法:挖掘Stack Overflow和github中的数据。
An Empirical Study on Bugs inside TensorFlow (DASFAA’20) [PDF]
内容:探究TensorFlow框架内部bug的症状、根本原因和位置。
方法:挖掘2017-2019年之间github上的bug。
A Comprehensive Study on Challenges in Deploying Deep Learning Based Software (ESEC/FSE’20) [PDF]
内容:探究部署深度学习应用的挑战。
方法:挖掘Stack Overflow的数据。
An Empirical Study on Deployment Faults of Deep Learning Based Mobile Applications (ICSE’21) [PDF]
内容:探究在移动端部署深度学习应用时的错误的症状和解决办法。
方法:挖掘Stack Overflow和github中的数据。
其他领域的相关工作
A Characteristic Study on Failures of Production Distributed Data-Parallel Programs (ICSE’13) [PDF]
内容:探究分布式数据并行程序中数据和代码的缺陷的symptom、root cause、fix以及debugging practice。
方法:挖掘Microsoft集群中的SCOPE job。
Software Documentation Issues Unveiled (ICSE’19) [PDF]
内容:对文档中的问题进行分类。
方法:挖掘emails, github issue, GitHub pull-requests和 Stack Overflow中的数据。
Going Big: A Large-Scale Study on What Big Data Developers Ask (ESEC/FSE’19) [PDF]
内容:探究大数据开发者所关心的主题、主题分类、主题流行度、主题难度、主题流行度和难度之间的关联度。
方法:挖掘Stack Overflow的数据。
Understanding Privacy-Related Questions on Stack Overflow (CHI’20) [PDF]
内容:探究SO用户会将什么话题与“隐私”问题关联,以及用户为什么要参与到隐私相关话题中。
方法:挖掘Stack Overflow的数据。
Understanding Build Issue Resolution in Practice: Symptoms and Fix Patterns (ESEC/FSE’20) [PDF]
内容:探究构建(build)中用户所关心的话题、遇到问题的症状及根本原因。
方法:挖掘Stack Overflow的数据。
Interpreting Cloud Computer Vision Pain-Points: A Mining Study of Stack Overflow (ICSE’20) [PDF]
内容:分析探究Cloud CV领域研究者遇到的痛点。
方法:挖掘Stack Overflow的数据。
An Empirical Study on API Usage (TSE’19) [PDF]
An Empirical Study on API-Misuse Bugs in Open-Source C Programs (COMPSAC’19) [PDF]