Track: YPS Poster Session & YPS Reception

Victoria Clerico ⋅ Corey Lammie ⋅ Garima Singh ⋅ Orhun G√∂rkem ⋅ William Simon ⋅ Hsinyu Tsai ⋅ Jeronimo Castrillon ⋅ Abu Sebastian ⋅ Hadjer Benmeziane

23

Toward a Small ML Runtime Stack for Raspberry Pi 5 QPUs

Yiannis Hadjiyianni ⋅ Panos Michelakis ⋅ Dimitrios Stamoulis ⋅ Yiannis Hadjiyianni

24

Communication-Efficient Distributed Inference for Transformer Models via Vector Quantized Context

Xiao Liu ⋅ Lijun Zhang ⋅ Deepak Ganesan ⋅ Hui Guan

25

LearnedCache: An eBPF-Integrated Perceptron-Based Eviction Policy for the Linux Page Cache

Zejia Qi

26

Accelerating LLM Inference: Self-Speculative Decoding via Learned Seed Injection

Anuradha Pandey ⋅ Anuradha Pandey

27

HADIS: Hybrid Adaptive Diffusion Model Serving for Efficient Text-to-Image Generation

Qizheng Yang ⋅ Tung-I Chen ⋅ Siyu Zhao ⋅ Ramesh Sitaraman ⋅ Hui Guan

28

Leveraging ASIC AI Chips for Homomorphic Encryption

Jianming Tong ⋅ Tianhao Huang ⋅ Jingtian Dang ⋅ Leo de Castro ⋅ Anirudh Itagi ⋅ Anupam Golder ⋅ Asra Ali ⋅ Jevin Jiang ⋅ Jeremy Kun ⋅ Arvind Arvind ⋅ G. Edward Suh ⋅ Tushar Krishna ⋅ Tianhao Huang ⋅ Jeremy Kun ⋅ Jingtian Dang

29

Shortcut-connected Expert Parallelism for Accelerating Mixture of Experts

Weilin Cai ⋅ Le Qin ⋅ Junwei Cui ⋅ Jiayi Huang

3

Speciesism in the Assistant Axis: Probing Compassion Vectors in Post-Trained LLMs

Shubham Gupta ⋅ Jasmine Brazilek

30

ov_training_kit : Model training and inference on local AI PC to strengthen the AI ecosystem

Shivam Basia

31

NeSyKV: Neuro-Symbolic Architecture-Specific KV-Cache Eviction for LLM Inference

Pratik Poudel ⋅ Jason Liu ⋅ Yanzhao Wu ⋅ Sumit Jha

32

DriftBench: Measuring and Predicting Infrastructure Drift in LLM Serving Systems

Gianluigi Vitale

33

ViRuleEval: A Neuro-Symbolic System for Interpretable Evaluation of Text-to-Video Generation

Chufeng Jiang ⋅ Heng Li

34

Kascade: A Practical Sparse Attention Method for Long-Context LLM Inference

Dhruv Rajesh Deshmukh ⋅ SAURABH GOYAL ⋅ NIPUN KWATRA ⋅ Ramachandran Ramjee

35

Designing Communication-Efficient AI Systems: An Interconnect-Aware HPC Perspective

Jinghan Yao

36

AccelOpt: A Self-Improving LLM Agentic System for AI Accelerator Kernel Optimization

Genghan Zhang ⋅ Shaowei Zhu ⋅ Anjiang Wei ⋅ Zhenyu Song ⋅ Allen Nie ⋅ Zhen Jia ⋅ Nandita Vijaykumar ⋅ Yida Wang ⋅ Kunle Olukotun ⋅ Shaowei Zhu ⋅ Anjiang Wei ⋅ Zhenyu Song

37