MLSys 2021 Schedule

Symposium

Mon Apr 05 08:30 AM -- 05:00 PM (PDT)

Chips and Compilers Symposium

Mu Li · Tianqi Chen

Remarks

Tue Apr 06 08:00 AM -- 08:15 AM (PDT)

Opening Remarks

Alex Dimakis · Ion Stoica · Alexander Smola

Invited Talk

Tue Apr 06 08:20 AM -- 09:10 AM (PDT)

Directions for Deep Learning Hardware

William Dally

Break

Tue Apr 06 09:10 AM -- 09:30 AM (PDT)

Break

Oral

Tue Apr 06 09:30 AM -- 09:50 AM (PDT)

ModularNAS: Towards Modularized and Reusable Neural Architecture Search

In Session 1: Search and Devices

Yunfeng Lin · Guilin Li · Xing Zhang · Weinan Zhang · Bo Chen · Ruiming Tang · Zhenguo Li · Jiashi Feng · Yong Yu

[ Paper PDF]

Oral

Tue Apr 06 09:50 AM -- 10:10 AM (PDT)

Fluid: Resource-aware Hyperparameter Tuning Engine

In Session 1: Search and Devices

Peifeng Yu · Jiachen Liu · Mosharaf Chowdhury

[ Paper PDF]

Oral

Tue Apr 06 10:10 AM -- 10:30 AM (PDT)

MicroNets: Neural Network Architectures for Deploying TinyML Applications on Commodity Microcontrollers

In Session 1: Search and Devices

Colby Banbury · Chuteng Zhou · Igor Fedorov · Ramon Matas · Urmish Thakker · Dibakar Gope · Vijay Janapa Reddi · Matthew Mattina · Paul Whatmough

[ Paper PDF]

Oral

Tue Apr 06 10:30 AM -- 10:50 AM (PDT)

Characterizing and Taming Model Instability Across Edge Devices

In Session 1: Search and Devices

Eyal Cidon · Evgenya Pergament · Zain Asgar · Asaf Cidon · Sachin Katti

[ Paper PDF]

Break

Tue Apr 06 10:50 AM -- 11:10 AM (PDT)

Break

Oral

Tue Apr 06 11:10 AM -- 11:30 AM (PDT)

Cortex: A Compiler for Recursive Deep Learning Models

In Session 2: Compilers

Pratik Fegade · Tianqi Chen · Phillip Gibbons · Todd Mowry

[ Paper PDF]

Oral

Tue Apr 06 11:30 AM -- 11:50 AM (PDT)

A Deep Learning Based Cost Model for Automatic Code Optimization

In Session 2: Compilers

Riyadh Baghdadi · Massinissa Merouani · Mohamed-Hicham LEGHETTAS · Kamel Abdous · Taha Arbaoui · Karima BENATCHBA · Saman Amarasinghe

[ Paper PDF]

Oral

Tue Apr 06 11:50 AM -- 12:10 PM (PDT)

Learning Fitness Functions for Machine Programming

In Session 2: Compilers

Shantanu Mandal · Todd Anderson · Javier Turek · Justin Gottschlich · Shengtian Zhou · Abdullah Muzahid

[ Paper PDF]

Oral

Tue Apr 06 12:10 PM -- 12:30 PM (PDT)

CODE: Compiler-based Neuron-aware Ensemble training

In Session 2: Compilers

Ettore M. G. Trainiti · Thanapon Noraset · David Demeter · Doug Downey · Simone Campanoni

[ Paper PDF]

Break

Tue Apr 06 12:30 PM -- 01:30 PM (PDT)

Lunch break

Oral

Tue Apr 06 01:30 PM -- 01:50 PM (PDT)

Pufferfish: Communication-efficient Models At No Extra Cost

In Session 3: Communication and Storage

Hongyi Wang · Saurabh Agarwal · Dimitris Papailiopoulos

[ Paper PDF]

Oral

Tue Apr 06 01:50 PM -- 02:10 PM (PDT)

In-network Aggregation for Shared Machine Learning Clusters

In Session 3: Communication and Storage

Nadeen Gebara · Manya Ghobadi · Paolo Costa

[ Paper PDF]

Oral

Tue Apr 06 02:10 PM -- 02:30 PM (PDT)

Data Movement Is All You Need: A Case Study on Optimizing Transformers

In Session 3: Communication and Storage

Andrei Ivanov · Nikoli Dryden · Tal Ben-Nun · Shigang Li · Torsten Hoefler

[ Paper PDF]

Oral

Tue Apr 06 02:30 PM -- 02:50 PM (PDT)

Learning on Distributed Traces for Data Center Storage Systems

In Session 3: Communication and Storage

Giulio Zhou · Martin Maas

[ Paper PDF]

Break

Tue Apr 06 02:50 PM -- 03:20 PM (PDT)

Break

Oral

Tue Apr 06 03:20 PM -- 03:40 PM (PDT)

TensorFlow Lite Micro: Embedded Machine Learning for TinyML Systems

In Session 4: Training (I)

Robert David · Jared Duke · Advait Jain · Vijay Janapa Reddi · Nat Jeffries · Jian Li · Nick Kreeger · Ian Nappier · Meghna Natraj · Tiezhen Wang · Pete Warden · Rocky Rhodes · Rocky Rhodes

[ Paper PDF]

Oral

Tue Apr 06 03:40 PM -- 04:00 PM (PDT)

Scaling Distributed Training with Adaptive Summation

In Session 4: Training (I)

Saeed Maleki · Madan Musuvathi · Todd Mytkowicz · Olli Saarikivi · Tianju Xu · Vadim Eksarevskiy · Jaliya Ekanayake · Emad Barsoum

[ Paper PDF]

Oral

Tue Apr 06 04:00 PM -- 04:20 PM (PDT)

PipeMare: Asynchronous Pipeline Parallel DNN Training

In Session 4: Training (I)

Bowen Yang · Jian Zhang · Jonathan Li · Christopher Re · Christopher Aberger · Christopher De Sa

[ Paper PDF]

Oral

Tue Apr 06 04:20 PM -- 04:40 PM (PDT)

EXPLORING THE LIMITS OF CONCURRENCY IN ML TRAINING ON GOOGLE TPUS

In Session 4: Training (I)

Sameer Kumar · Yu Wang · Cliff Young · James Bradbury · Naveen Kumar · Dehao Chen · Andy Swing

[ Paper PDF]

Oral

Tue Apr 06 04:40 PM -- 05:00 PM (PDT)

TT-Rec: Tensor Train Compression for Deep Learning Recommendation Models

In Session 4: Training (I)

Chunxing Yin · Bilge Acun · Carole-Jean Wu · Xing Liu

[ Paper PDF]

Poster

Tue Apr 06 05:00 PM (PDT) @ Virtual

MicroNets: Neural Network Architectures for Deploying TinyML Applications on Commodity Microcontrollers

In Poster Session 1

Colby Banbury · Chuteng Zhou · Igor Fedorov · Ramon Matas · Urmish Thakker · Dibakar Gope · Vijay Janapa Reddi · Matthew Mattina · Paul Whatmough

[ Paper PDF] [ Slides]

Poster

Tue Apr 06 05:00 PM (PDT)

Pufferfish: Communication-efficient Models At No Extra Cost

In Poster Session 1

Hongyi Wang · Saurabh Agarwal · Dimitris Papailiopoulos

[ Paper PDF]

Poster

Tue Apr 06 05:00 PM (PDT)

A Deep Learning Based Cost Model for Automatic Code Optimization

In Poster Session 1

Riyadh Baghdadi · Massinissa Merouani · Mohamed-Hicham LEGHETTAS · Kamel Abdous · Taha Arbaoui · Karima BENATCHBA · Saman Amarasinghe

[ Paper PDF]

Poster

Tue Apr 06 05:00 PM (PDT)

Scaling Distributed Training with Adaptive Summation

In Poster Session 1

Saeed Maleki · Madan Musuvathi · Todd Mytkowicz · Olli Saarikivi · Tianju Xu · Vadim Eksarevskiy · Jaliya Ekanayake · Emad Barsoum

[ Paper PDF]

Poster

Tue Apr 06 05:00 PM (PDT) @ Virtual

Cortex: A Compiler for Recursive Deep Learning Models

In Poster Session 1

Pratik Fegade · Tianqi Chen · Phillip Gibbons · Todd Mowry

[ Paper PDF] [ Slides]

Poster

Tue Apr 06 05:00 PM (PDT) @ Virtual

In-network Aggregation for Shared Machine Learning Clusters

In Poster Session 1

Nadeen Gebara · Manya Ghobadi · Paolo Costa

[ Paper PDF] [ Slides]

Poster

Tue Apr 06 05:00 PM (PDT)

Learning Fitness Functions for Machine Programming

In Poster Session 1

Shantanu Mandal · Todd Anderson · Javier Turek · Justin Gottschlich · Shengtian Zhou · Abdullah Muzahid

[ Paper PDF]

Poster

Tue Apr 06 05:00 PM (PDT)

EXPLORING THE LIMITS OF CONCURRENCY IN ML TRAINING ON GOOGLE TPUS

In Poster Session 1

Sameer Kumar · Yu Wang · Cliff Young · James Bradbury · Naveen Kumar · Dehao Chen · Andy Swing

[ Paper PDF]

Poster

Tue Apr 06 05:00 PM (PDT)

TensorFlow Lite Micro: Embedded Machine Learning for TinyML Systems

In Poster Session 1

Robert David · Jared Duke · Advait Jain · Vijay Janapa Reddi · Nat Jeffries · Jian Li · Nick Kreeger · Ian Nappier · Meghna Natraj · Tiezhen Wang · Pete Warden · Rocky Rhodes · Rocky Rhodes

[ Paper PDF]

Poster

Tue Apr 06 05:00 PM (PDT)

Fluid: Resource-aware Hyperparameter Tuning Engine

In Poster Session 1

Peifeng Yu · Jiachen Liu · Mosharaf Chowdhury

[ Paper PDF]

Poster

Tue Apr 06 05:00 PM (PDT)

ModularNAS: Towards Modularized and Reusable Neural Architecture Search

In Poster Session 1

Yunfeng Lin · Guilin Li · Xing Zhang · Weinan Zhang · Bo Chen · Ruiming Tang · Zhenguo Li · Jiashi Feng · Yong Yu

[ Paper PDF]

Poster

Tue Apr 06 05:00 PM (PDT)

Data Movement Is All You Need: A Case Study on Optimizing Transformers

In Poster Session 1

Andrei Ivanov · Nikoli Dryden · Tal Ben-Nun · Shigang Li · Torsten Hoefler

[ Paper PDF]

Poster

Tue Apr 06 05:00 PM (PDT) @ Virtual

TT-Rec: Tensor Train Compression for Deep Learning Recommendation Models

In Poster Session 1

Chunxing Yin · Bilge Acun · Carole-Jean Wu · Xing Liu

[ Paper PDF] [ Slides]

Poster

Tue Apr 06 05:00 PM (PDT)

CODE: Compiler-based Neuron-aware Ensemble training

In Poster Session 1

Ettore M. G. Trainiti · Thanapon Noraset · David Demeter · Doug Downey · Simone Campanoni

[ Paper PDF]

Poster

Tue Apr 06 05:00 PM (PDT)

Learning on Distributed Traces for Data Center Storage Systems

In Poster Session 1

Giulio Zhou · Martin Maas

[ Paper PDF]

Poster

Tue Apr 06 05:00 PM (PDT)

PipeMare: Asynchronous Pipeline Parallel DNN Training

In Poster Session 1

Bowen Yang · Jian Zhang · Jonathan Li · Christopher Re · Christopher Aberger · Christopher De Sa

[ Paper PDF]

Poster

Tue Apr 06 05:00 PM (PDT)

Characterizing and Taming Model Instability Across Edge Devices

In Poster Session 1

Eyal Cidon · Evgenya Pergament · Zain Asgar · Asaf Cidon · Sachin Katti

[ Paper PDF]

Session

Tue Apr 06 05:00 PM (PDT)

Poster Session 1

Invited Talk

Wed Apr 07 08:00 AM -- 08:50 AM (PDT)

Trustworthy AI

Jeannette Wing

Break

Wed Apr 07 08:50 AM -- 09:10 AM (PDT)

Break

Oral

Wed Apr 07 09:10 AM -- 09:30 AM (PDT)

An Efficient Statistical-based Gradient Compression Technique for Distributed Training Systems

In Session 5: Gradients and Precision

Ahmed M. Abdelmoniem · Ahmed Elzanaty · Mohamed-Slim Alouini · Marco Canini

[ Paper PDF]

Oral

Wed Apr 07 09:30 AM -- 09:50 AM (PDT)

Adaptive Gradient Communication via Critical Learning Regime Identification

In Session 5: Gradients and Precision

Saurabh Agarwal · Hongyi Wang · Kangwook Lee · Shivaram Venkataraman · Dimitris Papailiopoulos

[ Paper PDF]

Oral

Wed Apr 07 09:50 AM -- 10:10 AM (PDT)

Don't Forget to Sign the Gradients!

In Session 5: Gradients and Precision

Omid Aramoon · Pin-Yu Chen · Gang Qu

[ Paper PDF]

Oral

Wed Apr 07 10:10 AM -- 10:30 AM (PDT)

Rethinking Floating Point Overheads for Mixed Precision DNN Accelerators

In Session 5: Gradients and Precision

Hamzah Abdelaziz · ali shafiee · Jong Hoon Shin · Ardavan Pedram · Joseph Hassoun

[ Paper PDF]

Oral

Wed Apr 07 10:30 AM -- 10:50 AM (PDT)

Bit Error Robustness for Energy-Efficient DNN Accelerators

In Session 5: Gradients and Precision

David Stutz · Nandhini Chandramoorthy · Matthias Hein · Bernt Schiele

[ Paper PDF]

Break

Wed Apr 07 10:50 AM -- 11:10 AM (PDT)

Break - Visit the

Oral

Wed Apr 07 11:10 AM -- 11:30 AM (PDT)

RL-Scope: Cross-stack Profiling for Deep Reinforcement Learning Workloads

In Session 6: Benchmarks, Cost models, and Profiling

James Gleeson · Srivatsan Krishnan · Moshe Gabel · Vijay Janapa Reddi · Eyal de Lara · Gennady Pekhimenko

[ Paper PDF]

Oral

Wed Apr 07 11:30 AM -- 11:50 AM (PDT)

A Learned Performance Model for Tensor Processing Units

In Session 6: Benchmarks, Cost models, and Profiling

Sam Kaufman · Mangpo Phothilimthana · Yanqi Zhou · Charith Mendis · Sudip Roy · Amit Sabne · Mike Burrows

[ Paper PDF]

Oral

Wed Apr 07 11:50 AM -- 12:10 PM (PDT)

Accounting for Variance in Machine Learning Benchmarks

In Session 6: Benchmarks, Cost models, and Profiling

Xavier Bouthillier · Pierre Delaunay · Mirko Bronzi · Assya Trofimov · Brennan Nichyporuk · Justin Szeto · Nazanin Mohammadi Sepahvand · Edward Raff · Kanika Madan · Vikram Voleti · Samira Ebrahimi Kahou · Vincent Michalski · Tal Arbel · Chris Pal · Gael Varoquaux · Pascal Vincent

[ Paper PDF]

Oral

Wed Apr 07 12:10 PM -- 12:30 PM (PDT)

Larq Compute Engine: Design, Benchmark and Deploy State-of-the-Art Binarized Neural Networks

In Session 6: Benchmarks, Cost models, and Profiling

Tom Bannink · Adam Hillier · Lukas Geiger · Tim de Bruin · Leon Overweel · Jelmer Neeven · Koen Helwegen

[ Paper PDF]

Break

Wed Apr 07 12:30 PM -- 01:30 PM (PDT)

Lunch Break / Visit the

Oral

Wed Apr 07 01:30 PM -- 01:50 PM (PDT)

IOS: Inter-Operator Scheduler for CNN Acceleration

In Session 7: Systems

Yaoyao Ding · Ligeng Zhu · Zhihao Jia · Gennady Pekhimenko · Song Han

[ Paper PDF]

Oral

Wed Apr 07 01:50 PM -- 02:10 PM (PDT)

Value Learning for Throughput Optimization of Deep Learning Workloads

In Session 7: Systems

Benoit Steiner · Chris Cummins · Horace He · Hugh Leather

[ Paper PDF]

Oral

Wed Apr 07 02:10 PM -- 02:30 PM (PDT)

ByzShield: An Efficient and Robust System for Distributed Training

In Session 7: Systems

Konstantinos Konstantinidis · Aditya Ramamoorthy

[ Paper PDF]

Oral

Wed Apr 07 02:30 PM -- 02:50 PM (PDT)

FirePlace: Placing Firecraker Virtual Machines with Hindsight Imitation

In Session 7: Systems

Bharathan Balaji · Christopher Kakovitch · Balakrishnan Narayanaswamy

[ Paper PDF]

Break

Wed Apr 07 02:50 PM -- 03:20 PM (PDT)

Break - Visit the

Oral

Wed Apr 07 03:20 PM -- 03:40 PM (PDT)

Nimble: Efficiently Compiling Dynamic Neural Networks for Model Inference

In Session 8: Inference

Haichen Shen · Jared Roesch · Zhi Chen · Wei Chen · Yong Wu · Mu Li · Vin Sharma · Zachary Tatlock · Yida Wang

[ Paper PDF]

Oral

Wed Apr 07 03:40 PM -- 04:00 PM (PDT)

MicroRec: Efficient Recommendation Inference by Hardware and Data Structure Solutions

In Session 8: Inference

Wenqi Jiang · Zhenhao He · Shuai Zhang · Thomas B. Preußer · Kai Zeng · Liang Feng · Jiansong Zhang · Tongxuan Liu · Yong Li · Jingren Zhou · Ce Zhang · Gustavo Alonso

[ Paper PDF]

Oral

Wed Apr 07 04:00 PM -- 04:20 PM (PDT)

VS-Quant: Per-vector Scaled Quantization for Accurate Low-Precision Neural Network Inference

In Session 8: Inference

Steve Dai · Rangha Venkatesan · Mark Ren · Brian Zimmer · William Dally · Brucek Khailany

[ Paper PDF]

Oral

Wed Apr 07 04:20 PM -- 04:40 PM (PDT)

Accelerate Inference of CNNs for Video Analysis While Preserving Exactness Exploiting Activation Sparsity

In Session 8: Inference

Toshiaki Wakatsuki · Sekitoshi Kanai · Yasuhiro Fujiwara

[ Paper PDF]

Oral

Wed Apr 07 04:40 PM -- 05:00 PM (PDT)

sensAI: ConvNets Decomposition via Class Parallelism for Fast Inference on Live Data

In Session 8: Inference

Guanhua Wang · Zhuang Liu · Brandon Hsieh · Siyuan Zhuang · Joseph Gonzalez · Trevor Darrell · Ion Stoica

[ Paper PDF]

Poster

Wed Apr 07 05:00 PM (PDT) @ Virtual

IOS: Inter-Operator Scheduler for CNN Acceleration

In Poster Session 2

Yaoyao Ding · Ligeng Zhu · Zhihao Jia · Gennady Pekhimenko · Song Han

[ Paper PDF] [ Slides]

Poster

Wed Apr 07 05:00 PM (PDT)

Rethinking Floating Point Overheads for Mixed Precision DNN Accelerators

In Poster Session 2

Hamzah Abdelaziz · ali shafiee · Jong Hoon Shin · Ardavan Pedram · Joseph Hassoun

[ Paper PDF]

Poster

Wed Apr 07 05:00 PM (PDT) @ Virtual

Don't Forget to Sign the Gradients!

In Poster Session 2

Omid Aramoon · Pin-Yu Chen · Gang Qu

[ Paper PDF] [ Slides]

Poster

Wed Apr 07 05:00 PM (PDT)

A Learned Performance Model for Tensor Processing Units

In Poster Session 2

Sam Kaufman · Mangpo Phothilimthana · Yanqi Zhou · Charith Mendis · Sudip Roy · Amit Sabne · Mike Burrows

[ Paper PDF]

Poster

Wed Apr 07 05:00 PM (PDT)

Accounting for Variance in Machine Learning Benchmarks

In Poster Session 2

Xavier Bouthillier · Pierre Delaunay · Mirko Bronzi · Assya Trofimov · Brennan Nichyporuk · Justin Szeto · Nazanin Mohammadi Sepahvand · Edward Raff · Kanika Madan · Vikram Voleti · Samira Ebrahimi Kahou · Vincent Michalski · Tal Arbel · Chris Pal · Gael Varoquaux · Pascal Vincent

[ Paper PDF]

Poster

Wed Apr 07 05:00 PM (PDT)

Adaptive Gradient Communication via Critical Learning Regime Identification

In Poster Session 2

Saurabh Agarwal · Hongyi Wang · Kangwook Lee · Shivaram Venkataraman · Dimitris Papailiopoulos

[ Paper PDF]

Poster

Wed Apr 07 05:00 PM (PDT)

Value Learning for Throughput Optimization of Deep Learning Workloads

In Poster Session 2

Benoit Steiner · Chris Cummins · Horace He · Hugh Leather

[ Paper PDF]

Poster

Wed Apr 07 05:00 PM (PDT) @ Virtual

VS-Quant: Per-vector Scaled Quantization for Accurate Low-Precision Neural Network Inference

In Poster Session 2

Steve Dai · Rangha Venkatesan · Mark Ren · Brian Zimmer · William Dally · Brucek Khailany

[ Paper PDF] [ Slides]

Poster

Wed Apr 07 05:00 PM (PDT)

RL-Scope: Cross-stack Profiling for Deep Reinforcement Learning Workloads

In Poster Session 2

James Gleeson · Srivatsan Krishnan · Moshe Gabel · Vijay Janapa Reddi · Eyal de Lara · Gennady Pekhimenko

[ Paper PDF]

Poster

Wed Apr 07 05:00 PM (PDT)

MicroRec: Efficient Recommendation Inference by Hardware and Data Structure Solutions

In Poster Session 2

Wenqi Jiang · Zhenhao He · Shuai Zhang · Thomas B. Preußer · Kai Zeng · Liang Feng · Jiansong Zhang · Tongxuan Liu · Yong Li · Jingren Zhou · Ce Zhang · Gustavo Alonso

[ Paper PDF]

Poster

Wed Apr 07 05:00 PM (PDT)

Larq Compute Engine: Design, Benchmark and Deploy State-of-the-Art Binarized Neural Networks

In Poster Session 2

Tom Bannink · Adam Hillier · Lukas Geiger · Tim de Bruin · Leon Overweel · Jelmer Neeven · Koen Helwegen

[ Paper PDF]

Poster

Wed Apr 07 05:00 PM (PDT)

Accelerate Inference of CNNs for Video Analysis While Preserving Exactness Exploiting Activation Sparsity

In Poster Session 2

Toshiaki Wakatsuki · Sekitoshi Kanai · Yasuhiro Fujiwara

[ Paper PDF]

Poster

Wed Apr 07 05:00 PM (PDT) @ Virtual

Bit Error Robustness for Energy-Efficient DNN Accelerators

In Poster Session 2

David Stutz · Nandhini Chandramoorthy · Matthias Hein · Bernt Schiele

[ Paper PDF] [ Slides]

Poster

Wed Apr 07 05:00 PM (PDT)

ByzShield: An Efficient and Robust System for Distributed Training

In Poster Session 2

Konstantinos Konstantinidis · Aditya Ramamoorthy

[ Paper PDF]

Poster

Wed Apr 07 05:00 PM (PDT)

An Efficient Statistical-based Gradient Compression Technique for Distributed Training Systems

In Poster Session 2

Ahmed M. Abdelmoniem · Ahmed Elzanaty · Mohamed-Slim Alouini · Marco Canini

[ Paper PDF]

Poster

Wed Apr 07 05:00 PM (PDT)

Nimble: Efficiently Compiling Dynamic Neural Networks for Model Inference

In Poster Session 2

Haichen Shen · Jared Roesch · Zhi Chen · Wei Chen · Yong Wu · Mu Li · Vin Sharma · Zachary Tatlock · Yida Wang

[ Paper PDF]

Poster

Wed Apr 07 05:00 PM (PDT)

FirePlace: Placing Firecraker Virtual Machines with Hindsight Imitation

In Poster Session 2

Bharathan Balaji · Christopher Kakovitch · Balakrishnan Narayanaswamy

[ Paper PDF]

Poster

Wed Apr 07 05:00 PM (PDT)

sensAI: ConvNets Decomposition via Class Parallelism for Fast Inference on Live Data

In Poster Session 2

Guanhua Wang · Zhuang Liu · Brandon Hsieh · Siyuan Zhuang · Joseph Gonzalez · Trevor Darrell · Ion Stoica

[ Paper PDF]

Session

Wed Apr 07 05:00 PM (PDT)

Poster Session 2

Invited Talk

Thu Apr 08 08:00 AM -- 08:50 AM (PDT)

Machine Learning in Science: Applications, Algorithms and Architectures

Kathy Yelick

[ Slides]

Break

Thu Apr 08 08:50 AM -- 09:10 AM (PDT)

Break - Visit the

Oral

Thu Apr 08 09:10 AM -- 09:30 AM (PDT)

Boveda: Building an On-Chip Deep Learning Memory Hierarchy Brick by Brick

In Session 9: Hardware

Isak Edo Vivancos · Sayeh Sharify · Daniel Ly-Ma · Ameer Abdelhadi · Ciaran Bannon · Milos Nikolic · Mostafa Mahmoud · Alberto Delmas Lascorz · Gennady Pekhimenko · Andreas Moshovos

[ Paper PDF]

Oral

Thu Apr 08 09:30 AM -- 09:50 AM (PDT)

Horizontally Fused Training Array: An Effective Hardware Utilization Squeezer for Training Novel Deep Learning Models

In Session 9: Hardware

Shang Wang · Peiming Yang · Yuxuan Zheng · Xin Li · Gennady Pekhimenko

[ Paper PDF]

Oral

Thu Apr 08 09:50 AM -- 10:10 AM (PDT)

A Distributed Graph-Theoretic Framework for Automatic Parallelization in Multi-core Systems

In Session 9: Hardware

Guixiang Ma · Yao Xiao · Theodore Willke · Nesreen Ahmed · Shahin Nazarian · Paul Bogdan

[ Paper PDF]

Oral

Thu Apr 08 10:10 AM -- 10:30 AM (PDT)

Accelerating SLIDE Deep Learning on Modern CPUs: Vectorization, Quantizations, Memory Optimizations, and More

In Session 9: Hardware

Shabnam Daghaghi · Nicholas Meisburger · Mengnan Zhao · Anshumali Shrivastava

[ Paper PDF]

Oral

Thu Apr 08 10:30 AM -- 10:50 AM (PDT)

Scaling Polyhedral Neural Network Verification on GPUs

In Session 9: Hardware

Christoph Müller · François Serre · Gagandeep Singh · Markus Püschel · Martin Vechev

[ Paper PDF]

Break

Thu Apr 08 10:50 AM -- 11:10 AM (PDT)

Break - Visit the

Oral

Thu Apr 08 11:10 AM -- 11:30 AM (PDT)

SUOD: Accelerating Large-Scale Unsupervised Heterogeneous Outlier Detection

In Session 10: Techniques, and more Techniques

Yue Zhao · Xiyang Hu · Cheng Cheng · Cong Wang · Changlin Wan · Wen Wang · Jianing Yang · Haoping Bai · Zheng Li · Cao Xiao · Yunlong Wang · Zhi Qiao · Jimeng Sun · Leman Akoglu

[ Paper PDF]

Oral

Thu Apr 08 11:30 AM -- 11:50 AM (PDT)

Lost in Pruning: The Effects of Pruning Neural Networks beyond Test Accuracy

In Session 10: Techniques, and more Techniques

Lucas Liebenwein · Cenk Baykal · Brandon Carter · David Gifford · Daniela Rus

[ Paper PDF]

Oral

Thu Apr 08 11:50 AM -- 12:10 PM (PDT)

Equality Saturation for Tensor Graph Superoptimization

In Session 10: Techniques, and more Techniques

Yichen Yang · Mangpo Phothilimthana · Yisu Wang · Max Willsey · Sudip Roy · Jacques Pienaar

[ Paper PDF]

Oral

Thu Apr 08 12:10 PM -- 12:30 PM (PDT)

Doping: A technique for Extreme Compression of LSTM Models using Sparse Structured Additive Matrices

In Session 10: Techniques, and more Techniques

Urmish Thakker · Paul Whatmough · ZHIGANG LIU · Matthew Mattina · Jesse Beu

[ Paper PDF]

Break

Thu Apr 08 12:30 PM -- 01:30 PM (PDT)

Lunch Break / Visit the

Oral

Thu Apr 08 01:30 PM -- 01:50 PM (PDT)

Swift for TensorFlow: A portable, flexible platform for deep learning

In Session 11: Tools

Brennan Saeta · Denys Shabalin

[ Paper PDF]

Oral

Thu Apr 08 01:50 PM -- 02:10 PM (PDT)

Amazon SageMaker Debugger: A System for Real-Time Insights into Machine Learning Model Training

In Session 11: Tools

Nathalie Rauschmayr · Vikas Kumar · Rahul Huilgol · Andrea Olgiati · Satadal Bhattacharjee · Nihal Harish · Vandana Kannan · Amol Lele · Anirudh Acharya · Jared Nielsen · Lakshmi Ramakrishnan · Ishan Bhatt · Kohen Chia · Neelesh Dodda · Zhihan Li · Jiacheng Gu · Miyoung Choi · Balajee Nagarajan · Jeffrey Geevarghese · Denis Davydenko · Sifei Li · Lu Huang · Edward Kim · Tyler Hill · Krishnaram Kenthapadi

[ Paper PDF]

Oral

Thu Apr 08 02:10 PM -- 02:30 PM (PDT)

FLAML: A Fast and Lightweight AutoML Library

In Session 11: Tools

Chi Wang · Qingyun Wu · Markus Weimer · Erkang Zhu

[ Paper PDF]

Oral

Thu Apr 08 02:30 PM -- 02:50 PM (PDT)

To Bridge Neural Network Design and Real-World Performance: A Behaviour Study for Neural Networks

In Session 11: Tools

Xiaohu Tang · Shihao Han · Li Lyna Zhang · Ting Cao · Yunxin Liu

[ Paper PDF]

Break

Thu Apr 08 02:50 PM -- 03:20 PM (PDT)

Break - Visit the

Oral

Thu Apr 08 03:20 PM -- 03:40 PM (PDT)

Towards Scalable Distributed Training of Deep Learning on Public Cloud Clusters

In Session 12: Training (II)

Shaohuai Shi · Xianhao Zhou · Shutao Song · Xingyao Wang · Zilin Zhu · Xue Huang · Xinan Jiang · Feihu Zhou · Zhenyu Guo · Liqiang Xie · Rui Lan · Xianbin Ouyang · Yan Zhang · Jieqian Wei · Jing Gong · Weiliang Lin · Ping Gao · Peng Meng · Xiaomin Xu · Chenyang Guo · Bo Yang · Zhibo Chen · Yongjian Wu · Xiaowen Chu

[ Paper PDF]

Oral

Thu Apr 08 03:40 PM -- 04:00 PM (PDT)

Understanding and Improving Failure Tolerant Training for Deep Learning Recommendation with Partial Recovery

In Session 12: Training (II)

Kiwan Maeng · Shivam Bharuka · Isabel Gao · Mark Jeffrey · Vikram Saraph · Bor-Yiing Su · Caroline Trippel · Jiyan Yang · Mike Rabbat · Brandon Lucia · Carole-Jean Wu

[ Paper PDF]

Oral

Thu Apr 08 04:00 PM -- 04:20 PM (PDT)

Wavelet: Efficient DNN Training with Tick-Tock Scheduling

In Session 12: Training (II)

Guanhua Wang · Kehan Wang · Kenan Jiang · XIANGJUN LI · Ion Stoica

[ Paper PDF]

Oral

Thu Apr 08 04:20 PM -- 04:40 PM (PDT)

Pipelined Backpropagation at Scale: Training Large Models without Batches

In Session 12: Training (II)

Atli Kosson · Vitaliy Chiley · Abhinav Venigalla · Joel Hestness · Urs Koster

[ Paper PDF]

Remarks

Thu Apr 08 04:40 PM -- 05:00 PM (PDT)

Closing Remarks

Poster

Thu Apr 08 05:00 PM (PDT)

To Bridge Neural Network Design and Real-World Performance: A Behaviour Study for Neural Networks

In Poster Session 3

Xiaohu Tang · Shihao Han · Li Lyna Zhang · Ting Cao · Yunxin Liu

[ Paper PDF]

Poster

Thu Apr 08 05:00 PM (PDT) @ Virtual

Scaling Polyhedral Neural Network Verification on GPUs

In Poster Session 3

Christoph Müller · François Serre · Gagandeep Singh · Markus Püschel · Martin Vechev

[ Paper PDF] [ Slides]

Poster

Thu Apr 08 05:00 PM (PDT)

A Distributed Graph-Theoretic Framework for Automatic Parallelization in Multi-core Systems

In Poster Session 3

Guixiang Ma · Yao Xiao · Theodore Willke · Nesreen Ahmed · Shahin Nazarian · Paul Bogdan

[ Paper PDF]

Poster

Thu Apr 08 05:00 PM (PDT)

Boveda: Building an On-Chip Deep Learning Memory Hierarchy Brick by Brick

In Poster Session 3

Isak Edo Vivancos · Sayeh Sharify · Daniel Ly-Ma · Ameer Abdelhadi · Ciaran Bannon · Milos Nikolic · Mostafa Mahmoud · Alberto Delmas Lascorz · Gennady Pekhimenko · Andreas Moshovos

[ Paper PDF]

Poster

Thu Apr 08 05:00 PM (PDT) @ Virtual

Pipelined Backpropagation at Scale: Training Large Models without Batches

In Poster Session 3

Atli Kosson · Vitaliy Chiley · Abhinav Venigalla · Joel Hestness · Urs Koster

[ Paper PDF] [ Slides]

Poster

Thu Apr 08 05:00 PM (PDT)

Towards Scalable Distributed Training of Deep Learning on Public Cloud Clusters

In Poster Session 3

Shaohuai Shi · Xianhao Zhou · Shutao Song · Xingyao Wang · Zilin Zhu · Xue Huang · Xinan Jiang · Feihu Zhou · Zhenyu Guo · Liqiang Xie · Rui Lan · Xianbin Ouyang · Yan Zhang · Jieqian Wei · Jing Gong · Weiliang Lin · Ping Gao · Peng Meng · Xiaomin Xu · Chenyang Guo · Bo Yang · Zhibo Chen · Yongjian Wu · Xiaowen Chu

[ Paper PDF]

Poster

Thu Apr 08 05:00 PM (PDT)

Doping: A technique for Extreme Compression of LSTM Models using Sparse Structured Additive Matrices

In Poster Session 3

Urmish Thakker · Paul Whatmough · ZHIGANG LIU · Matthew Mattina · Jesse Beu

[ Paper PDF]

Poster

Thu Apr 08 05:00 PM (PDT)

Wavelet: Efficient DNN Training with Tick-Tock Scheduling

In Poster Session 3

Guanhua Wang · Kehan Wang · Kenan Jiang · XIANGJUN LI · Ion Stoica

[ Paper PDF]

Poster

Thu Apr 08 05:00 PM (PDT)

Swift for TensorFlow: A portable, flexible platform for deep learning

In Poster Session 3

Brennan Saeta · Denys Shabalin

[ Paper PDF]

Poster

Thu Apr 08 05:00 PM (PDT)

Equality Saturation for Tensor Graph Superoptimization

In Poster Session 3

Yichen Yang · Mangpo Phothilimthana · Yisu Wang · Max Willsey · Sudip Roy · Jacques Pienaar

[ Paper PDF]

Poster

Thu Apr 08 05:00 PM (PDT)

Horizontally Fused Training Array: An Effective Hardware Utilization Squeezer for Training Novel Deep Learning Models

In Poster Session 3

Shang Wang · Peiming Yang · Yuxuan Zheng · Xin Li · Gennady Pekhimenko

[ Paper PDF]

Poster

Thu Apr 08 05:00 PM (PDT)

FLAML: A Fast and Lightweight AutoML Library

In Poster Session 3

Chi Wang · Qingyun Wu · Markus Weimer · Erkang Zhu

[ Paper PDF]

Poster

Thu Apr 08 05:00 PM (PDT) @ Virtual

Lost in Pruning: The Effects of Pruning Neural Networks beyond Test Accuracy

In Poster Session 3

Lucas Liebenwein · Cenk Baykal · Brandon Carter · David Gifford · Daniela Rus

[ Paper PDF] [ Slides]

Poster

Thu Apr 08 05:00 PM (PDT)

Accelerating SLIDE Deep Learning on Modern CPUs: Vectorization, Quantizations, Memory Optimizations, and More

In Poster Session 3

Shabnam Daghaghi · Nicholas Meisburger · Mengnan Zhao · Anshumali Shrivastava

[ Paper PDF]

Poster

Thu Apr 08 05:00 PM (PDT)

Amazon SageMaker Debugger: A System for Real-Time Insights into Machine Learning Model Training

In Poster Session 3

Nathalie Rauschmayr · Vikas Kumar · Rahul Huilgol · Andrea Olgiati · Satadal Bhattacharjee · Nihal Harish · Vandana Kannan · Amol Lele · Anirudh Acharya · Jared Nielsen · Lakshmi Ramakrishnan · Ishan Bhatt · Kohen Chia · Neelesh Dodda · Zhihan Li · Jiacheng Gu · Miyoung Choi · Balajee Nagarajan · Jeffrey Geevarghese · Denis Davydenko · Sifei Li · Lu Huang · Edward Kim · Tyler Hill · Krishnaram Kenthapadi

[ Paper PDF]

Poster

Thu Apr 08 05:00 PM (PDT)

SUOD: Accelerating Large-Scale Unsupervised Heterogeneous Outlier Detection

In Poster Session 3

Yue Zhao · Xiyang Hu · Cheng Cheng · Cong Wang · Changlin Wan · Wen Wang · Jianing Yang · Haoping Bai · Zheng Li · Cao Xiao · Yunlong Wang · Zhi Qiao · Jimeng Sun · Leman Akoglu

[ Paper PDF]

Poster

Thu Apr 08 05:00 PM (PDT) @ Virtual

Understanding and Improving Failure Tolerant Training for Deep Learning Recommendation with Partial Recovery

In Poster Session 3

Kiwan Maeng · Shivam Bharuka · Isabel Gao · Mark Jeffrey · Vikram Saraph · Bor-Yiing Su · Caroline Trippel · Jiyan Yang · Mike Rabbat · Brandon Lucia · Carole-Jean Wu

[ Paper PDF] [ Slides]

Session

Thu Apr 08 05:00 PM (PDT)

Poster Session 3

Workshop

Fri Apr 09 06:15 AM -- 03:00 PM (PDT)

Personalized Recommendation Systems and Algorithms

Udit Gupta · Carole-Jean Wu · Gu-Yeon Wei · David Brooks

Workshop

Fri Apr 09 07:00 AM -- 04:00 PM (PDT)

Workshop of Graph Neural Networks and Systems (GNNSys'21)

Xavier Bresson · Michael Bronstein · Stefanie Jegelka · George Karypis · Petar Veličković · Zheng Zhang

Workshop

Fri Apr 09 07:00 AM -- 03:00 PM (PDT)

2nd On-Device Intelligence Workshop

Paul Whatmough · Vijay Janapa Reddi · Chuteng Zhou · Igor Federov · Matthew Mattina · Pete Warden · Ganesh Venkatesh · Vikas Chandra

Workshop

Fri Apr 09 07:45 AM -- 04:00 PM (PDT)

SysML4Health: Scalable Systems for ML-driven Analytics in Healthcare

Alexey Tumanov · Jimeng Sun · Tushar Krishna · Vivek Sarkar · Dawn Song

Workshop

Fri Apr 09 08:00 AM -- 03:00 PM (PDT)

Journal of Opportunities, Unexpected limitations, Retrospectives, Negative results, and Experiences

Abhishek Gupta · Udit Gupta · Mayoore Jaiswal · Lillian Pentecost · Shagun Sodhani · David Brooks · Joelle Pineau

Workshop

Fri Apr 09 08:00 AM -- 05:00 PM (PDT)

Benchmarking Machine Learning Workloads on Emerging Hardware

Tom St John · Murali Emani

Query	Result
Kernel	Current meeting year events with kernel in the abstract, author names, room location, date, or abstract
Deep Learning	Deep or Learning
"Deep Learning"	Deep Learning
@"Boston University"	Search for "Boston University" but only in the Institution and email fields of authors. Prefix a search term with the @ symbol to constrain it to just email and institution.