Если вы всё ещё думаете, что Rust — это про ржавчину, то у меня для вас плохие новости и отличную утилиту. Google представила Magika 1.0 — стабильный релиз ИИ-инструмента, который угадывает тип файла быстрее, чем вы успеете открыть file(1), и делает это с обезоруживающей точностью.
Главная новость — движок переписан на Rust. Итог: выше скорость, стабильнее память, меньше шансов наступить на грабли undefined behavior. Magika теперь распознаёт свыше 200 типов вместо прежних ~100 и уверенно отличает коварных двойников: JSON от JSONL, TSV от CSV, C от C++, JavaScript от TypeScript. Для разработчика это не просто приятная мелочь, а спасение от тонких ошибок в пайплайнах.
Как её научили такому? Данные. Много данных. Команда прогнала 3 ТБ обучающих наборов и подкрепила редкие кейсы синтетическими примерами, сгенерированными Gemini. Это позволило покрыть форматы, для которых в природе почти нет больших корпусов, — от экзотических логов до нишевых конфигов.
Под капотом — ONNX Runtime для инференса и Tokio для параллелизма. В сухих цифрах это около 1000 файлов в секунду на одном современном ноутбучном ядре с линейным масштабированием по CPU. То есть локально можно прогонять огромные деревья проектов, а на сервере — разбирать артефакты, как на конвейере.
Кому это нужно? Командам безопасности — чтобы не пропустить вредонос под маской «невинного» расширения. DevOps и дата-инженерам — для автоматических пайплайнов, где ошибка формата равна падению всего процесса. Разработчикам — для быстрых анализаторов, статических чекеров и IDE-плагинов. В работе доступны интеграции для Python и TypeScript плюс нативный CLI на Rust.
Установка — одной командой (curl или PowerShell), код — полностью open source. Репозиторий на GitHub, документация — в открытом доступе. В итоге Magika 1.0 — не просто «детектор расширений», а аккуратный ИИ-скальпель: быстро, безопасно, предсказуемо. И, да, теперь JSONL вы с ней не перепутаете — даже в понедельник утром.
