采集 | 数据智能与计算机图形学领域2019推荐论文列表(附链接)
优采云 发布时间: 2020-08-14 15:29本文约3600字,建议阅读10分钟。
2019年度数据智能与估算及图形学领域论文推荐。
数据智能
1. Data-anonymous Encoding for Text-to-SQL Generation
论文链接:
在跨领域 Text-to-SQL 研究中一个重要的问题是辨识自然语言句子中提及的列名、表格、及单元格的值。本文中提出了一种基于中间变量和多任务学习的框架,尝试同时解决表格实体辨识和语义解析问题,取得了良好的疗效。论文在 EMNLP 2019 会议发表。
2. Towards Complex Text-to-SQL in Cross-domain Database
论文链接:
计算机的可执行语言(例如 SQL 语句与储存结构紧密相关)与自然语言存在不匹配问题,给复杂问题的语义解析带来了困难。为了解决这个问题,论文中设计了一种中间语言。先将自然语言转换成中间语言,再将中间语言转换成 SQL,可以提升语义解析的准确率。该论文已在 ACL 2019 会议发表。
3. Leveraging Adjective-Noun Phrasing Knowledge for Comparison Relation Prediction in Text-to-SQL
论文链接:
在自然语言理解中,知识的运用极其重要。本文以 Adjective-Noun Phrasing Knowledge 为切入点尝试在 Text-to-SQL 中运用语言相关知识来提升语言理解的准确率。论文在 EMNLP 2019 会议发表。
4. FANDA: A Novel Approach to Perform Follow-up Query Analysis
论文链接:
在多履带对话中,对话句子中常常存在省略或指代,需要依据上下文来理解当前词句。本文剖析总结了在对话式数据剖析中普遍出现的省略或指代现象,并提出了将当前句子补充完整的方式。论文发表在 AAAI 2019。
5. A Split-and-Recombine Approach for Follow-up Query Analysis
论文链接:
本文中提出了一个处理上下文的 split-recombine 框架,能够拿来有效处理对话句子中常常存在上下文省略或指代问题。这个框架既可以用于将当前句子补充完整(restate),也可以直接生成 logic form(例如SQL)。论文发表在 EMNLP 2019。
6. QuickInsights: Quick and Automatic Discovery of Insights from Multi-Dimensional Data
论文链接:
该论文创新性地提出了多维数据中洞察 (insights) 的一种普遍适用的具象定义,并系统化地提出了面向*敏*感*词*多维数据的有效的洞察挖掘算法。文章发表在 SIGMOD 2019。相应技术从2015年起转化到谷歌 Power BI,Office 365 等产品中。
7. TableSense: Spreadsheet Table Detection with Convolutional Neural Networks
论文链接:
文章提出的基于深度学习模型的 TableSense 技术,可对电子表格进行区域监测和表格结构理解,并将其转换为结构化的多维数据进行手动剖析。这项技术已转化到谷歌的 Office 365 产品中,随 Ideas in Excel 功能全面上线。文章发表在 AAAI 2019。
8. Text-to-Viz: Automatic Generation of Infographics from Proportion-Related Natural language Statements
论文链接:
该论文发表在 IEEE VIS 2019,首创了由自然语言手动生成数据信息图(Infographics)的技术。该技术让人们就能十分容易的获得大量数据信息图的设计,用于强化数据故事的抒发。
9. DataShot: Automatic Generation of Fact Sheets from Tabular Data
论文链接:
该论文发表在 IEEE VIS 2019,提出了一种从数据表格出发手动生成由多个数据信息图组合而成的数据海报的技术。
10. Towards Automated Infographic Design: Deep Learning-based Auto-Extraction of Extensible Timeline
论文链接:
该论文提出了一种手动从图片中抽取数据信息图模板的技术。利用计算机视觉技术,将时间轴的设计图片分解成多个视觉元素并重新组合,使可视化时间轴设计图片的重用成为了可能。该论文发表在 IEEE VIS 2019。
11. Visualization Assessment: A Machine Learning Approach
论文链接:
该论文发表在 IEEE VIS 2019,探索了手动评估可视化图片特点的方式,比如记忆度、美观度,让机器学习的算法在可视化的生成、推荐中发挥作用。
12. Supporting Story Synthesis: Bridging the Gap between Visual Analytics and Storytelling
论文链接:
该论文定义了一个新的故事生成框架,将数据剖析到结果展示的过程具象成普遍的故事生成流程。该框架支持交互式地从复杂的可视剖析结果中生成可以使普通读者理解的故事。论文发表在 TVCG 2019。
13. Cross-dataset Time Series Anomaly Detection for Cloud Systems
论文链接:
文章提出了基于迁移学习和主动学习的跨数据集异常检查框架,可以有效地在不同时间序列数据集之间进行迁移,只须要1%-5% 的标明样本量即可达到高精度检查。文章发表在系统领域顶尖大会 USENIX ATC 2019 上。
14. Robust Log-based Anomaly Detection on Unstable Log Data
论文链接:
文章提出了基于深度学习技术的模型 LogRobust,可有效克服日志不稳定问题,在快速迭代的实际工业数据中取得了出色的疗效,该研究发表在了软件工程领域顶尖大会 FSE 2019。
15. An Intelligent, End-To-End Analytics Service for Safe Deployment in Large-Scale Cloud Infrastructure
论文链接:
该文章提出了时空相关性模型,在时间和空间的双重维度上对比故障前后的系统状态,为故障确诊提供线索,该模型在安全布署中取得了很高的准确率,研究成果将发表在系统领域顶尖大会 NSDI 2020上。
16. Outage Prediction and Diagnosis for Cloud Service Systems
论文链接:
该文章提出了一种智能的*敏*感*词*中断预警机制 AirAlert,AirAlert 采集整个云系统中的所有系统监控讯号,采用鲁棒梯度提高树算法做预测,并借助贝叶斯网络进行确诊剖析。相关研究短文发表在 WWW 2019。
17. Prediction-Guided Design for Software Systems
论文链接:
文章提出了智能缓冲区管理方式,基于预测导向(Prediction-Guided)框架,以机器学习预测引擎为核心,可监控集群已布署的工作负载与平台操作,对这种负载在发生故障的机率和新的容量下降需求进行预测,动态调整预留缓冲区。该方式已成功集成到谷歌 Azure 中,提高了容量配置的稳健性,减少了巨大的成本开支。相关研究将在 AAAI 2020 Workshop 发布。
18. An Empirical Investigation of Incident Triage for Online Service Systems
论文链接:
该文章基于谷歌 20 个小型在线服务系统展开实例研究,发现错误的故障分派会导致额外的时间开支,进而验证了已有软件 Bug 分派算法在故障分派场景下的疗效。这是首次研究故障分派在工业小型在线服务系统中的实践,相关研究发表在 ICSE SEIP 2019。
19. Continuous Incident Triage for Large-Scale Online Service Systems
论文链接:
该文章提出一种基于深度学习的自动化连续故障分派算法 DeepCT。DeepCT 结合了一个新的基于注意力机制的屏蔽策略、门控循环单元模型和改进后的损失函数,可以从工程师对问题的讨论中逐渐积累知识并优化分派结果。相关成果发表在 ASE 2019。
20. Neural Feature Search: A Neural Architecture for Automated Feature Engineering
论文链接:
文章提出了神经特点搜索(Neural Feature Search,NFS),基于递归神经网络(Recurrent Neural Network,RNN)的控制器,通过最有潜力的变换规则变换每位原创特点,取得了优于现有手动特点工程方式的性能。该成果已在在数据挖掘领域大会 ICDM 2019 发表,在手动特点工程研究领域确立了新的技术水平。
图形学
21. Repairing Man-Made Meshes via Visual Driven Global Optimization with Minimum Intrusion
论文链接:
文章提出的方式修补了 ShapeNet、ModelNet 等小型 3D 数据集中的模型缺陷。该文章发表在 SIGGRAPH Asia 2019。
22. Learning Adaptive Hierarchical Cuboid Abstractions of 3D Shape 采集s
论文链接:
人造物体如衣柜一般具有结构化特点,人类可以容易地将那些物体抽象化为简单的几何形状的组合,如长方体,便于物体理解和剖析。该论文通过在同类物体上进行无监督学习,生成具有自适应并层次化的长方体具象抒发。文章发表在 SIGGRAPH Asia 2019。
23. A Scalable Galerkin Multigrid Method for Real-time Simulation of Deformable Objects
论文链接:
一种在无结构网格上的 Galerkin 多重网格法,其极大加速了现有柔性体仿真技术的性能。该方式可实时仿真含近百万有限元的柔性体模型,将人们在虚拟世界中可交互的模型复杂度提高了一到两个量级。该论文发表在 SIGGRAPH Asia 2019。
24. Deep Inverse Rendering for High-resolution SVBRDF Estimation from an Arbitrary Number of Images
论文链接:
该论文提出了一种在纹理材质本征空间进行优化的方式,实现了针对任意数目输入图片的纹理材质建模。在给定图象数目较少时给出视觉上合理的结果,而随着输入数目的增多,逐渐得到更为精确的重建结果。该论文发表在 SIGGRAPH 2019。
25. Synthesizing 3D Shapes from Silhouette Image 采集s using Multi-Projection Generative Adversarial Networks
论文链接:
利用二维轮廓图象学习三维形体生成。该方式仅须要对于某一类物体的大量二维轮廓图象,并不需要任何对应关系,它通过该类别物体在不同方向上的轮廓所具有的特点分布,学习并生成满足这种训练数据分布的三维形体。该论文发表在 CVPR 2019。