大连理工大学江贺,聂黎明-面向任务的代码搜索
2020-02-27 591浏览
- 1.软件工程研究与实践2016(SEPR2016)论坛 面向任务的代码搜索 江贺 (jianghe@dlut.edu.cn) 聂黎明 (limingnie@mail.dlut.edu.cn) 大连理工大学 合作者: 孙泽义 任志磊 李晓晨 孔维强 张涛 罗夏朴
- 2.代码搜索 在软件开发过程中,代码搜索能够为开发者提供参考 的代码段去辅助完成特定的编程任务。 2016/7/25 / 2
- 3.Section One 基础数据和 影响力分析 By 江贺
- 4.基础数据和影响力分析 • 收集了93篇与代码/API 推荐相关的文献 • 作者总计208个,国家16个。 • 分析回答以下问题: • 1. Where? 作者来自哪里? • 2. Who? 谁是最高产的作者?影响力如何? • 3. Which? 那篇文章被引次数最多? • 4. Co-authorship network 合著网络? 4
- 5.作者来自哪里? Israel, 3 Belgium, 3 India, 4 Germany, 4 Italy, 5 Singapore, 4 Iran, 1 Switzerland, 2 France, 1 Thailand, 1 South Korea, 8 Brazil, 9 Japan, 11 Canada, 19 USA, 83 作者总计208个 国家16个 China, 50 USA China Canada Japan Brazil South Korea Italy Germany India Belgium Israel Singapore Switzerland France Iran Thailand 5
- 6.谁是最高产的作者? 序号 作者 相关论文篇数 1 David Lo 2 Collin McMillan 3 Denys Poshyvanyk 4 Shaowei Wang 5 Mark Grechanik 6 Emily Hill 7 Tao Xie 8 Reid Holmes 9 Sushil Bajracharya 10 Cristina Lopes 10 8 8 8 7 6 4 4 4 4 H-index 33 11 39 11 20 18 49 20 20 40 国家 Singapore USA USA Singapore USA USA USA Canada USA USA 6
- 7.谁是最高产的作者? 序号 作者 相关论文篇数 1 David Lo 2 Collin McMillan 3 Denys Poshyvanyk 4 Shaowei Wang 5 Mark Grechanik 6 Emily Hill 7 Tao Xie 8 Reid Holmes 9 Sushil Bajracharya 10 Cristina Lopes 10 8 8 8 7 6 4 4 4 4 H-index 33 11 39 11 20 18 49 20 20 40 国家 Singapore USA USA Singapore USA USA USA Canada USA USA 7
- 8.作者影响力? 序号 作者 相关论文篇数 ACS指数 总被引次数 1 Tao Xie 2 Reid Holmes 3 Gail C. Murphy 4 Steven P. Reiss 5 Suresh Thummalapenta 6 K. Vijay-Shanker 7 Naiyana Sahavechaphan 8 Kajal Claypool 9 David Mandelin 10 Lin Xu 4 4 2 1 2 3 1 1 1 1 245.3 184.8 165.7 165.0 156.0 121.6 100.5 100.5 87.5 87.5 723 411 350 165 309 483 201 201 350 350 注: ACS不仅衡量了作者对文章的贡献度,还衡量了对该领域的贡献度 8
- 9.作者影响力? 序号 作者 相关论文篇数 ACS指数 总被引次数 1 Tao Xie 2 Reid Holmes 3 Gail C. Murphy 4 Steven P. Reiss 5 Suresh Thummalapenta 6 K. Vijay-Shanker 7 Naiyana Sahavechaphan 8 Kajal Claypool 9 David Mandelin 10 Lin Xu 4 4 2 1 2 3 1 1 1 1 245.3 184.8 165.7 165.0 156.0 121.6 100.5 100.5 87.5 87.5 723 411 350 165 309 483 201 201 350 350 注: ACS不仅衡量了作者对文章的贡献度,还衡量了对该领域的贡献度 9
- 10.哪篇文章被引数最多? 序号 题目 被引次 数 给出文章的截图 1 Jungloidmining:helping to navigate the API jungle 350 2Parseweb:a programmer assistant for reusing open source code on the web 306 3 Using structural context to recommend source code examples 294 4XSnippet:mining For sample code 201 5 Mining API patterns as partial orders from sourcecode:from usage scenarios to specifications 201 6 Using natural language program analysis to locate and understand action-oriented concerns 182 7MAPO:Mining and Recommending API Usage Patterns 180 8 Example-centricprogramming:integrating web search into the development environment 173 9 Semantics-based code search 165 10 Learning from examples to improve code completion systems 155 NCII 期刊 31.82 PLDI 2005 34.00 ASE 2007 26.73 20.10 ICSE 2005 OOPSLA 2006 22.33 FSE 2007 20.22 25.71 AOSD 2007 ECOOP 2009 28.83 CHI 2010 23.57 22.14 ICSE 2009 FSE2009 10
- 11.哪篇文章被引数最多? 序号 题目 被引次 NCII 期刊 数 1 给出文章的截图 Jungloidmining:helping to navigate the API jungle 350 31.82 PLDI 2005 2Parseweb:a programmer assistant for reusing open source code on the web 306 34.00 ASE 2007 3 Using structural context to recommend source code examples 294 26.73 ICSE 2005 4XSnippet:mining For sample code 201 20.10 OOPSLA 2006 5 Mining API patterns as partial orders from sourcecode:from 1.Jungloidmuisnagienscgen:arhioestlopspinecgificattoionns avigate th2e01 AP2I2.j3u3 nFgSEle20,07 PLDI 2005.6 Using natural language program analysis to locate and understand action-oriented concerns 182 20.22 AOSD 2007 2.7ParsMeAwPOe:Mbin:inagapndrRoegcormammendmingeArPIaUssasgeisPattaternnst for18r0eus2i5n.7g1 ECOOP 2009 3o.p98UesniEnsxgaomupslert-rccueenctrticSthcueeopmdrrodaeagnvertelialcmocspo-mbmonaiensnnegtd:tteheicnnotevxedigertorwsantetmioaneregcnbhrwte,ebcAsoeSamrcEhmin2toe0n0d71176.s35our2238c..58e37 e1x0amLeparnleingsf,rIoCm eSxaEmpl2es0to0im5p.rove code completion systems 155 22.14 CHI 2010 coICdSEe 2009 FSE2009 11
- 12.作者合著网络(1) 12
- 13.作者合著网络 (2) 13
- 14.作者合著网络 (3) 14
- 15.Section Two 代码搜索的 两个尝试 By 聂黎明
- 16.代码搜索的分类 按输入类型分: 自由文本作为查询(面向任务的代码搜索) • Lv et al. ASE 2015, Keivanloo et al. ICSE 2014, McMillan et al. TOSEM 2013, Bajracharya et al. FSE 2010. API作为查询 • Subramanian et al. ICSE 2014, Ghafari et al. ICPC 2014, Moritz ASE 2013, Wang et al. ASE 2011. Zhong et al. ECOOP 2009. Code(context)作为查询 • Nguyen et al. ICSE 2012, Rahman et al. WCRE 2014. 其它形式的查询 • Stolee et al. TOSEM 2014, Inoue et al. ICSE 2012, Thummalapenta et al. ASE 2007, Holmes et al. ICSE 2005. 自动代码修复 • Zhong et al. ICSE 2015, Pei et al. ICSE 2015, Tao et al. FSE 2014, Kim et al. ICSE 2013. 2016/7/25 /
- 17.推荐粒度--代码片段 代码片段指的是Java 的一个类(class)中的某个方法。 它包含了注释和代码,代码有方法名和方法体。 2016/7/25 /
- 18.面向任务的代码搜索 代码段仓库 发现1:现有的代码推荐主要借助于信息检索的方 法,匹配方式单一,效果不佳。 Solution:融合了信息检索和监督学习的方法。充分 利用领域特征来构建分类器,为新查询推荐代码段。 自由文本的查询 record audio sound 不同 BM25 搜索方法 Portfolio Iman 推荐 结果 自由文本作为查询的 代码推荐方法的一般框架 2016/7/25 /
- 19.ROSF:'>ROSF: