Transferring Troubles: Cross-Lingual Transferability of Backdoor Attacks in LLMs with Instruction Tuning | allainews.com

May 1, 2024, 4:48 a.m. | Xuanli He, Jun Wang, Qiongkai Xu, Pasquale Minervini, Pontus Stenetorp, Benjamin I. P. Rubinstein, Trevor Cohn

cs.CL updates on arXiv.org arxiv.org

arXiv:2404.19597v1 Announce Type: new
Abstract: The implications of backdoor attacks on English-centric large language models (LLMs) have been widely examined - such attacks can be achieved by embedding malicious behaviors during training and activated under specific conditions that trigger malicious outputs. However, the impact of backdoor attacks on multilingual models remains under-explored. Our research focuses on cross-lingual backdoor attacks against multilingual LLMs, particularly investigating how poisoning the instruction-tuning data in one or two languages can affect the outputs in languages …

abstract arxiv attacks backdoor cross-lingual cs.cl cs.cr embedding english however impact instruction tuning language language models large language large language models llms training type

More from arxiv.org / cs.CL updates on arXiv.org

Statler: State-Maintaining Language Models for Embodied Reasoning 11 hours ago | arxiv.org

abstract arxiv cs.cl cs.ro +16

MoSECroT: Model Stitching with Static Word Embeddings for Crosslingual Zero-shot Transfer 11 hours ago | arxiv.org

abstract arxiv cs.ai cs.cl +26

Deception Detection from Linguistic and Physiological Data Streams Using Bimodal Convolutional Neural Networks 11 hours ago | arxiv.org

abstract application arxiv concerns +19

Using Natural Language Explanations to Improve Robustness of In-context Learning 11 hours ago | arxiv.org

abstract adversarial arxiv context +22

Direct Neural Machine Translation with Task-level Mixture of Experts models 11 hours ago | arxiv.org

abstract arxiv cs.cl data +16

Jury: A Comprehensive Evaluation Toolkit 11 hours ago | arxiv.org

arxiv cs.ai cs.cl evaluation +3

You Only Look at Screens: Multimodal Chain-of-Action Agents 11 hours ago | arxiv.org

action agents arxiv cs.ai +6

Draft & Verify: Lossless Large Language Model Acceleration via Self-Speculative Decoding 11 hours ago | arxiv.org

abstract arxiv cs.cl decoding +19

NaijaRC: A Multi-choice Reading Comprehension Dataset for Nigerian Languages 11 hours ago | arxiv.org

abstract arxiv create cross-lingual +16

Software Engineer for AI Training Data (School Specific)

@ G2i Inc | Remote

View on ai-jobs.net

Software Engineer for AI Training Data (Python)

@ G2i Inc | Remote

View on ai-jobs.net

Software Engineer for AI Training Data (Tier 2)

@ G2i Inc | Remote

View on ai-jobs.net

Data Engineer

@ Lemon.io | Remote: Europe, LATAM, Canada, UK, Asia, Oceania

View on ai-jobs.net

Artificial Intelligence – Bioinformatic Expert

@ University of Texas Medical Branch | Galveston, TX

View on ai-jobs.net

Intern - Robotics Industrial Engineer Summer 2024

@ Vitesco Technologies | Seguin, US

View on ai-jobs.net