Publications

Rishav Hada, Safiya Husain, Varun Gumma, Harshita Diddee, Aditya Yadavalli, Agrima Seth, Nidhi Kulkarni, Ujwal Gadiraju, Aditya Vashistha, Vivek Seshadri, Kalika Bali

ACM FAccT (2024)

ABS PDF

METAL: Towards Multilingual Meta-Evaluation

Rishav Hada*, Varun Gumma*, Mohamed Ahmed, Kalika Bali, Sunayana Sitaram

ACL Findings (2024)

ABS PDF Code

MEGAVERSE: Benchmarking Large Language Models Across Languages, Modalities, Models and Tasks

Sanchit Ahuja, Divyanshu Aggarwal, Varun Gumma, Ishaan Watts, Ashutosh Sathe, Millicent Ochieng, Rishav Hada, Prachi Jain, Mohamed Ahmed, Kalika Bali, SunayanaSitaram

NAACL (2024)

ABS PDF Code

Are Large Language Model-based Evaluators the Solution to Scaling Up Multilingual Evaluation?

Rishav Hada, Varun Gumma, Adrian Wynter, Harshita Diddee, Mohamed Ahmed, Monojit Choudhury, Kalika Bali, Sunayana Sitaram

ACL Findings (2024)

ABS PDF Code

MAFIA: Multi-Adapter Fused Inclusive Language Models

Prachi Jain*, Ashutosh Sathe*, Varun Gumma, Kabir Ahuja, Sunayana Sitaram

EACL (2024)

ABS PDF

MunTTS: A Text-to-Speech System for Mundari

Varun Gumma, Rishav Hada, Aditya Yadavalli, Pamir Gogoi, Ishani Mondal, Vivek Seshadri, Kalika Bali

ComputEL (2024)

ABS PDF Code

IndicTrans2: Towards High-Quality and Accessible Machine Translation Models for all 22 Scheduled Indian Languages

Jay Gala*, Pranjal A Chitale*, A K Raghavan, Varun Gumma, Sumanth Doddapaneni, Aswanth Kumar M, Janki Atul Nawale, Anupama Sujatha, Ratish Puduppully, Vivek Raghavan, Pratyush Kumar, Mitesh M Khapra, Raj Dabre, Anoop Kunchukuttan

TMLR (2023)

ABS PDF Code Models

An Empirical Study of Leveraging Knowledge Distillation for Compressing Multilingual Neural Machine Translation Models

Varun Gumma, Raj Dabre, Pratyush Kumar

EAMT (2023)

ABS PDF Code

PAMMELA: Policy Administration Methodology using Machine Learning

Varun Gumma, Barsha Mitra, Soumyadeep Dey, Pratik Shashikantbhai Patel*, Sourabh Suman*, Saptarshi Das, Jaideep Vaidya

SECRYPT (2022)

ABS PDF Code

Publications

Preprints

OffTopicEval: When Large Language Models Enter the Wrong Chat, Almost Always!

The Role of Synthetic Data in Multilingual, Multi-Cultural AI Systems: Lessons from Indic Languages

HEALTH-PARIKSHA: Assessing RAG Models for Health Chatbots in Real-World Multilingual Settings

Published Papers

Towards Inducing Long-Context Abilities in Multilingual Neural Machine Translation Models

Beyond Metrics: Evaluating LLMs' Effectiveness in Culturally Nuanced, Low-Resource Real-World Scenarios

Contamination Report for Multilingual Benchmarks

PARIKSHA: A Large-Scale Investigation of Human-LLM Evaluator Agreement on Multilingual and Multi-Cultural Data

🥇 Akal Badi ya Bias: An Exploratory Study of Gender Bias in Hindi Language Technology

METAL: Towards Multilingual Meta-Evaluation

MEGAVERSE: Benchmarking Large Language Models Across Languages, Modalities, Models and Tasks

Are Large Language Model-based Evaluators the Solution to Scaling Up Multilingual Evaluation?

MAFIA: Multi-Adapter Fused Inclusive Language Models

MunTTS: A Text-to-Speech System for Mundari

IndicTrans2: Towards High-Quality and Accessible Machine Translation Models for all 22 Scheduled Indian Languages

An Empirical Study of Leveraging Knowledge Distillation for Compressing Multilingual Neural Machine Translation Models

PAMMELA: Policy Administration Methodology using Machine Learning