fn main() { println!("Hello, Rust!"); println!("... Goodbye!");}
Синтаксис это первое, на что обращают внимание разработчики,
впервые столкнувшись с кодом на Rust. И сложно найти что-то другое,
что вызывало бы больше негодования у новичков, и при этом такое, к
чему совершенно спокойно относятся уже "понюхавшие пороха"
Rust-программисты. Посмотрите, например, сколько эмоций вызывает
синтаксис Rust у комментаторов одной из типичных новостей про Rust на OpenNET:
Язык не для меня, нахожу его немного убогим в плане
синтаксиса, но мне нравится много идей тем, взять хотя бы
управление памятью.
Вообще никак не зашел. Зашел он хейтерам крестов, может их кресты
както в детстве обидели, я не знаю. Но когда даже крестовики
говорят, что синтаксис конченый это очень серьезный повод
задуматься, крестов видели конченый синтаксис.
Самое интересное в этой истории то, что примеры на сайте раста типа
"привет мир", почему то намного более читабельные чем то, что
реально используется и лежит на гитхабе, а там адовый синтаксис с
кучей спец символов и какая то ещё жуткая муть.
Сначала хотел указать вам на ошибку, но потом понял, что
"синтоксис" в данном контексте, нужно понимать как "токсичный
синтаксис". Вот это именно то, чего мне не хватало что бы
охарактеризовать раст.
Теперь я точно знаю: Раст это ЯП с ТОКСИЧНМ СИНТАКСИСОМ!
Новый язык должен бить старые по всем параметрам уверенно и с
превосходством. Rust это не новая технология, это всё что было
раньше только с инфраструктурой и плохо читаемым синтаксисом.
Да вообще не понимаю, чего все ополчились на Rust. Нормальный язык
с нормальным синтаксисом, надо просто мозгом думать.
Синтаксис языка, безусловно, имеет значение. Но сама величина
его важности условна: для людей, только начинающих знакомство с
языком, она больше. А вот для разработчиков, уже привыкших к языку,
гораздо важнее выразительность: то есть не синтаксис сам по себе в
абстрактном отношении с собой, а то, насколько язык хорошо
справляется с выражением требуемых концепций и насколько они легко
воспринимаются.
Как ни печально, но встречают язык по голому синтаксису. И
синтаксис Rust тут не предлагает чего-то революционного. По сути
это обычный C-подобный синтаксис, который имеют и многие другие
языки, но с различными современными улучшениями. И они, как ни
странно, делают его лучше других, в ряде случаев
выразительнее.
Проблема в том, что сразу этого не видно. Чтобы оценить
выразительность, нужно уже владеть теми концепциями, языковую
запись которых требуется оценить. Более того, нужно также иметь
представление о проблемах выражения подобных концепций в других
языках и иметь в виду возможное наличие этих проблем при оценке.
Поэтому концептуальная сложность самого языка может выглядеть на
первый взгляд как переусложнение синтаксиса. На самом деле
синтаксис Rust не так плох, как о нем говорят. Он имеет множество
замечательных находок, которыми удобно пользоваться, и
вопреки расхожему мнению, читаются программы на Rust достаточно
хорошо.
Так давайте рассмотрим подробнее, чем именно синтаксис Rust не
угодил своим критикам и почему никто из них не может предложить
ничего лучше, когда их просят это сделать.
Фигурные скобки
Многие люди, которые критикуют языки программирования за
использование фигурных скобок и других спецсимволов, часто хотят,
чтобы программа выглядела подобно тексту на естественном языке. Но
такой формат совершенно неудобен для записи программного кода, и
вот почему: текст на естественном языке это просто запись
последовательного потока речи, тогда как текст программы
это чаще выражение структурных отношений между элементами
кода. Очевидно, что графическими обозначениями зачастую можно
добиться большей выразительности при записи структур, будь то
спецсимволы или отступы.
Выделение блоков кода одними лишь отступами имеет свои
преимущества, но чаще всего оно требует серьезной дисциплины от
программиста. Особенно при перемещении фрагментов кода из одного
места в другое, из одного уровня вложенности в другой. Читаемость
кода улучшается, но возрастает напряжение внимания при работе с
кодом, возникает почва для появления досадных ошибок.
Интересно, что одна из главных проблем, которую должно было
решить обозначение блоков отступами это проблема несоответствия
между отступами и реальной синтаксической группировкой инструкций.
При этом человек прочитывает один порядок, ориентируясь на отступы,
а парсер языка другой порядок, ориентируясь на правило, по которому
блок выделяется скобками:
if (test(x)) foo(x); bar(x);
Должен ли bar
вызываться только тогда, когда
test
завершился успешно? По правилам языка нет, так
как отсутствуют фигурные скобки, обозначающие блок. Но такое
форматирование кода затрудняет для человека понимание этого. Все
потому, что имеется лишняя избыточность в обозначении блоков:
скобками для парсера, отступами для человека, и они могут не
совпадать. Поэтому в Python решили отказаться от этой
избыточности:
if test(x): foo(x) bar(x)
Но ирония в том, что такое единообразное представление, тем не
менее, не устраняет возможную ошибку полностью. То есть,
ошибкой в первом примере могло быть не отсутствие фигурных скобок,
а наличие случайного отступа. Тогда программа в первом случае
работает правильно, но выглядит некорректной, тогда как во втором
случае она действительно некорректна.
Появление подобных ошибок наталкивает на мысль, что избыточность
в обозначении блоков не так уж и плоха, она позволяет ввести
дополнительные способы контроля. Более того, наличие скобок делает
возможным автоматическое расставление отступов: зная, что код был
отформатирован автоматически (например, по сохранению изменений в
файл), программист может визуально убедиться, что никакая
инструкция не съехала, все расставлено на своих позициях как
надо.
Даже без автоформатирования, Rust решает проблему случайных
отступов радикальным образом:
if test(x) { foo(x);}bar(x);
В конструкциях if
, else
,
for
, while
и так далее, блок требуется
обязательно! Сокращенная, бесскобочная запись тела у данных
операторов в языке просто отсутствует. С одной стороны, это
"загрязняет" фигурными скобками простые условия, но отчасти это
компенсируется тем, что теперь круглые скобки вокруг условного
выражения становятся избыточными и их можно убрать.
Вообще, в Rust блоки очень важны, они являются самостоятельными
программными объектами с особыми свойствами.
Во-первых, блоки обозначают область видимости переменных. По
достижении конца блока все переменные, введенные внутри блока,
уничтожаются и происходит освобождение занятых ими ресурсов:
...{ let mut data = data.lock().expect("Mutex should be lockable"); data.read(); data.write();}...
Здесь data
вне блока это мьютекс, содержащий
некоторые данные. А data
внутри блока это специальная
ссылка на защищенные мьютексом данные, которая формируется при
блокировке мьютекса и после удаления которой исходный мьютекс будет
разблокирован. То есть блок в данном случае ограничивает область
блокировки мьютекса, и встречаться подобные блоки могут в любом
месте, где допустимо размещение инструкций.
Во-вторых, блоки сами являются выражениями и они возвращают
значения! Значением блока считается значение последнего
вычисленного выражения в блоке, если оно не завершается точкой с
запятой. Иначе блок будет возвращать пустое значение.
let value = { let a = 1; let b = 2; a + b};
Очень удобно вводить локальные блоки и компоновать их с
выражениями вовне. Каким бы ни было простым это свойство блоков,
оно кардинально меняет способ работы с потоком выполнения: оно
позволяет не только локализовать связанные инструкции, но и
приносит в поток вложенную структурность. Благодаря этому, в
частности, становится ненужен специальный тернарный условный
оператор (что также избавляет от ряда проблем, с ним
связанных):
let value = if x < 42 { -1 } else { 1 };
А многие функции и замыкания избавляются от лишнего синтаксиса с
оператором возврата:
fn add_two(a: isize) -> isize { a + 2}
вместо
fn add_two(a: isize) -> isize { return a + 2;}
Для специальных блоков, таких как unsafe
и
async
, появляется возможно оборачивать ими только
часть выражения, что в ряде случаев удобно и делает код
нагляднее:
let a = 5 + unsafe { an_unsafe_fn() };
Сложно представить, как можно обеспечить удобную (и свободную от
известных ошибок) поддержку блоков такой же функциональности, не
используя скобок для их обозначения.
Точка с запятой
Отдельного рассмотрения заслуживает то, как работает точка с
запятой в Rust. Многим не нравятся языки, которые требуют окончания
инструкций точкой с запятой: зачем, если и так перевод строки может
означать завершение инструкции? Отказ от точки с запятой оправдан,
если в языке любая строка по-умолчанию является инструкцией, как в
Python. Если же язык использует концепцию "все есть выражение",
которая расширяет его выразительные возможности, то без
специального терминатора, по которому можно отличить
строку-инструкцию от строки-выражения, удобным в использовании
может быть только язык с динамической типизацией, такой как Ruby.
Да и в таком языке в ряде случаев подход "все есть выражение"
приводит к неудобствам:
class Foo def set_x val @val = val nil endend
Здесь возникает необходимость вставлять nil
в конце
блока, чтобы set_x
возвращал пустое значение, а не
результат выражения @val = val
, то есть не значение
val
. Если это еще терпимо, то ситуация становится
совершенно неприемлемой в случае статических языков и использования
ветвлений:
if x < 42 { foo(x)} else { bar(x)}
Здесь foo
возвращает число, но мы его не
используем, а bar
возвращает "пусто". Какого типа
должно быть значение всего условного выражения?
Для динамически типизированных языков подобный код приемлем,
потому что они допускают возврат значений разных типов в
зависимости от условия, которое проверяется во время выполнения
программы. Для статически типизированного языка все плохо, придется
ставить выражения-заглушки в каждой подобной ситуации, даже если
результат никто не присваивает.
Rust решает эту проблему элегантным способом, который позволяет
оставаться ему статически типизированным языком и при этом
использовать преимущества подхода "все есть выражение" без особых
хлопот. Способ заключается в том, что точка с запятой используется
не как простой разделитель инструкций, а как оператор, превращающий
выражение в инструкцию. При этом инструкция тоже интерпретируется
как выражение, которое всегда возвращает пустое значение:
if x < 42 { foo(x);} else { bar(x)}
Здесь foo
возвращает число, но мы его не
используем, и нам не нужно, чтобы оно возвращалось из данной ветки
условия, поэтому мы завершаем выражение точкой с запятой. При этом
bar
возвращает "пусто", а значит мы не обязаны ставить
точку с запятой после его вызова (но можем и поставить, для
симметрии), ибо типы возврата обеих веток уже совпали.
Интересно, что в совокупности с правилами владения и семантикой
перемещения по-умолчанию получается, что если объект был перемещен
в выражение, которое закончилось точкой с запятой и объект никуда
больше перемещен не был, то он удаляется:
let message = "Hello!".to_string();message;println!("{}", message); // error[E0382]: borrow of moved value: `message`
Так что инструкция a;
становится аналогом
drop(a)
. Это нужно помнить, чтобы не удивляться, когда
компилятор откажется компилировать инструкцию, в которой
производится попытка сохранить ссылку на перемещенное внутрь нее
значение.
В итоге подобное концептуальное расширение функций точки с
запятой весьма удобно в использовании. В подавляющем большинстве
случаев оно ни к каким проблемам не приводит, благодаря контролю
соответствия типов и времен жизни со стороны компилятора. Что же
касается "загрязнения" кода точками с запятой, то благодаря тому,
что теперь она не ставится в ряде распространенных случаев, доля
непустых строк в программах на Rust, содержащих точку с запятой,
составляет около 20%. Не так уж и много.
Постфиксная запись типа
Иногда простота синтаксиса является кажущейся. Например,
частенько задается вопрос: зачем в Rust используется постфиксная
запись типа, ведь это усложняет запись, еще и приходится отделять
имена от типа с помощью двоеточия, тогда как префиксная запись,
принятая в C/C++, этого не требует и выглядит чище. На самом деле
префиксная запись чище только в ряде простых случаев использования,
но в более сложных случаях она изрядно запутывает и парсер, и
человека.
Вообще, какой следует выбрать объективный критерий простоты
синтаксиса? Мне видится, что немаловажно для оценки простоты
синтаксиса является простота его парсера. Простой парсер может
стать важным преимуществом языка программирования, так как он
ускоряет время компиляции, разбор исходных файлов в IDE и утилитах
анализа и автоматического преобразования кода (статические
анализаторы, автоформатеры, авторефакторы и пр.). Кроме того,
простота разбора синтаксиса также важна и для человека: во-первых,
человеку тоже приходится "парсить" текст программы при ее чтении, а
во-вторых, однозначность синтаксиса упрощает поиск нужных строк по
кодовой базе, например, среди множества проектов на GitHub.
Рассмотрим пример объявления переменной определенного типа.
В Rust:
let i: u64;
В C++:
uint64_t i;
Первый вариант это "паскалевский" способ декларации типа. Хотя
он дополнительно "загрязнен" символом двоеточия, однако в общем
случае он проще, как для разбора парсером, так и для восприятия
человеком.
Прочитав i
в i: u64
, парсер уже знает,
что i
это имя переменной, прочитав :
он
знает, что дальше идет имя типа, прочитав u64
он
знает, что это имя типа, даже не сверяясь со списком имеющихся
типов (то есть не заглядывая в семантику). Такой подход избавляет
от необходимости декларировать тип до того, как будет объявлена
переменная этого типа. В C/C++ из-за этого приходится отдельно
делать объявления, отдельно определения, и иногда изменение порядка
деклараций может изменить семантику.
Для человеческого восприятия преимущества "паскалеской" записи
раскрываются в сложных случаях:
int (*fns[16])(int * const * p);
Проблема данного кода в том, что в нем синтаксис типа перемешан
с синтаксисом объявляемой переменной. Чтобы в этом разобраться,
нужно применять особое правило чтения по спирали.
Синтаксис же, принятый в Rust, отделяет обозначение типа от
имени переменной:
let fns: [fn(*const *mut isize) -> isize; 16];
Обозначение типа при этом всегда одинаково, вне зависимости от
того, указано ли оно в аннотации типа в инструкции
let
, в вызове size_of
или в объявлении
функции как тип возвращаемого значения.
Ну и стоит сказать, что "паскалевская" декларация упрощается в
случае автовыведения типа:
let a = foo();
Тип просто не указывается. Отсутствует также и двоеточие, что
улучшает читаемость кода в большинстве случаев использования
переменных.
Для человека, читающего код, имя переменной зачастую важнее ее
типа, поэтому логично, что оно ставится на первое место. К тому же
имена обычно более равномерны по длине, чем типы, и постфиксная
запись улучшает выравнивание полей и переменных в группе.
Зачем вообще нужен let?
Иногда let
ругают за его избыточность и ненужность.
Но обычно это делают те, кто не идет дальше элементарных примеров
объявления переменных в Rust. Дело в том, что инструкция
let
занимается не объявлением переменных, а
сопоставлением выражения с образцом (паттерном):
let PATTERN: EXPR_TYPE = EXPR;let PATTERN = EXPR;
В аннотации типа, если она требуется, указывается тип значения
выражения справа, а не тип отдельных переменных, которые могут
вводиться внутри паттерна (а могут и не вводиться). При этом
let
также используется в условиях if
и
while
, если вместо истинности логического выражения
там необходимо проверить соответствие выражения образцу:
if let PATTERN = EXPR { ...}while let PATTERN = EXPR { ...}
Сам синтаксис образца PATTERN
общий для всех мест,
где он может использоваться: помимо указанных let
,
if let
и while let
, это также оператор
match
, for
и аргументы функций и
замыканий (там уже нет надобности в отдельном слове
let
, так как ничего другого, кроме образца,
использовать в этих местах нельзя).
struct Foo { a: i32,}let Foo { a: mut b } = Foo { a: 25 };
В примере выше производится деструктуризация значения типа
Foo
и вводится новая переменная с именем
b
, которая получает свое значение из поля
a
и в дальнейшем может измениться.
В простых случаях паттерн может состоять только из одного имени
новой переменной, но это только частный случай. К тому же Rust не
требует, чтобы значения с новыми именами были связаны именно в той
же инструкции, где эти имена были объявлены:
let a;a = 25;
Наконец, Rust поддерживает затенение переменных:
let a = 25;// `a` имеет числовой типlet a = "hello";// теперь `a` имеет строковый тип
Во всех этих случаях нужно явно отличать let a
или
let a = 25
от просто a
или a =
25
, и ключевое слово let
прекрасно с этим
справляется.
Сокращения в ключевых
словах
Уж наверное только совсем ленивые критики синтаксиса Rust не
"проехались" по сокращениям в ключевых словах. Зачастую дело
выставляют таким образом, что Rust форсирует сокращения и
сплошняком только из них и состоит. Но на самом деле из 40 ключевых
слов языка сокращениями являются только 7:
fn, mut, mod, pub, impl, dyn, ref
При этом dyn
и ref
используются крайне
редко. Дополнительно есть еще 5 коротких ключевых слов (в две и три
буквы), которые не являются сокращениями:
if, as, let, for, use
Все остальные слова длиннее. Некоторые из них сделаны длинными
намеренно, например continue
и return
:
они используются редко и должны быть хорошо заметны в коде, хотя
первоначальные версии языка вместо них использовали слова
cont
и ret
.
Тем не менее, больше всего претензий возникает к ключевому слову
fn
. Предлагают обычно либо его убрать совсем, либо
заменить на function
.
На самом деле fn
весьма неплохой выбор для
достижения компромисса между двумя крайностями. Наличие длинного
слова function
особо не помогает при чтении кода,
обычно определение функции и так заметно по остальной ее сигнатуре
и обязательному блоку с ее телом. Оно только оттягивает на себя
внимание от имени и аргументов функции. К тому же оно занимает
слишком много места, что плохо сказывается не только на скорости
набора, но в ряде случаев и на чтении кода, например, в
мессенджерах.
Но и отсутствие ключевого слова тоже плохо, так как в этом
случае возникают ситуации, когда становится невозможно однозначно
отличить функциональный тип от других элементов языка:
let a: fn(i32, String); // `a` - указатель на функцию с двумя аргументамиlet b: (i32, String); // `b` - кортеж из двух элементов
Без специального ключевого слова, предваряющего имя объявляемой
функции, становится сложно искать строки объявления по кодовой
базе, так как они синтаксически становятся похожи на вызовы.
Хорошо, но почему бы не выбрать сокращение подлиннее, такое как
fun
или func
? Это довольно спорный вопрос
даже в Rust-сообществе, но fn
выглядит более
нейтральным, так как не является другим самостоятельным словом и не
имеет никаких посторонних значений по звучанию, так что оно хорошо
ассоциируется с function
и является минимально
возможным его сокращением.
Говоря о коротких ключевых словах и спецсимволах, стоит
заметить, что код с ними становится плохо читаемым в том случае,
если программист также выбирает короткие имена для объектов
программы. В таком случае глаз "спотыкается", становится сложно
отличить пользовательские имена от элементов языка. В случае же
использования длинных имен, дискомфорта не возникает, наоборот,
глазу становится проще отделять имена от синтаксических
конструкций, что улучшает восприятие кода. Поэтому такие слова как
fn
, mut
, mod
,
pub
, impl
, dyn
и
ref
, после которых идут пользовательские имена, не
затрудняют, а улучшают чтение программы, если при этом программист
выбирает длинные осмысленные имена для своих объектов, а не
увлекается сокращениями.
Стрелка в сигнатуре
функций
Другая частая претензия к объявлению функций в Rust, это
использование символа "стрелки" для разделения блока параметров от
типа возвращаемого функцией результата:
fn foo(x: i32) -> bool { ...}
Кажется, что последовательнее тут тоже использовать
двоеточие:
fn foo(x: i32): bool { ...}
Однако в таком случае создается впечатление, что тип
bool
относится ко всему выражению слева, то есть ко
всей функции, тогда как на самом деле он является только частью
функционального типа, указывающей тип возвращаемого значения.
Проблему становится заметно еще отчетливее в случае объявления
переменной функционального типа:
let foo: fn(x: i32) -> bool;
Против
let foo: fn(x: i32): bool;
Видно, что двоеточие во втором случае затрудняет для человека
восприятие типа, а стрелка подходит на его место лучше других
символов, так как это принятое обозначение во многих функциональных
языках, куда оно проникло из математики, из просто типизированного
лямбда исчисления.
В случае если функция не должна возвращать никакого значения, в
Rust считается, что она возвращает значение "пусто"
()
, и тип возвращаемого значения можно не указывать.
То есть
fn foo() -> () { ...}
равнозначно
fn foo() { ...}
Без подобного сахара для такого тривиального случая, от обилия
спецсимволов действительно начало бы пестрить в глазах.
Замыкания
В отличии от обычных функций, список аргументов у замыканий
выделяется не круглыми скобками, а вертикальными чертами:
foo().map(|x| x + 2)
В большинстве случаев у замыкания типы аргументов и тип
возвращаемого значения выводятся автоматически и указывать их не
нужно. Если все тело замыкания состоит только из одного выражения,
то фигурные скобки также можно не ставить.
Текущий синтаксис прошел определенную историю развития, в
процессе которого он избавился от всего лишнего и приобрел эту
окончательную, легковесную и лаконичную форму. Использование
вертикальных черт улучшает читаемость кода: замыкание хорошо
выделяется в группе аргументов функций, где оно используется чаще
всего, при этом его сложно спутать с кортежем или массивом.
Преимущества подобного синтаксиса достаточно очевидны, остается
загадкой, почему он не устраивает многих критиков языка. Пожалуй
действительную проблему представляют только некоторые вырожденные
случаи, например:
foo().map(|_| ())
Конструкция |_| ()
выглядит некрасиво. Она
означает, что мы игнорируем входной аргумент замыкания и возвращаем
из замыкания пустое значение. Подобный map
полезен,
когда нужно преобразовать одно значение типа Result
в
другое с заменой положительного значения возврата на "пусто".
Однако добиться этого можно и более наглядным образом, просто
передав функцию drop
вместо замыкания:
foo().map(drop)
Двоеточия в пути
В Rust используется двойное двоеточие ::
в качестве
квалификатора пространств имен, который разделяет сегменты в
логических путях к элементам (items) языка, при том, что для
доступа к полям и методам структур используется точка
.
. Это часто раздражает людей, привыкших к языкам, где
для доступа к полям и методам используется тот же синтаксис, что и
для доступа к элементам внутри пространства имен. Им кажется, что
синтаксически разделять эти два обращения совершенно избыточно, и
Rust использует подобное разделение либо в силу скудоумия своих
создателей, либо из-за желания подражать C++.
Однако на самом деле, предоставляемые Rust возможности требуют
явного синтаксического разделения статических обращений
xx::yy::zz
и динамических xx.yy.zz
, где
результат будет зависеть от значения объектов xx
,
yy
и zz
во время выполнения. Возможны
ситуации, когда программист должен использовать канонический путь
для обращения к методу, когда ему нужно явно указать тип или типаж,
на котором будет вызван данный метод:
let foo = Foo;foo.bar(); // вызов метода `bar` из `Foo`Bar::bar(&foo); // вызов метода `bar` из реализации типажа `Bar` для `Foo`
Такое происходит, когда разные типажи, реализованные для типа,
используют одинаковые имена методов, и разрешить конфликт имен
необходимо статическим указанием на конкретный типаж или тип, к
которому относится метод. Подобная запись вызовов оказывается
незаменимой при обобщенном программировании. Если использовать для
статического и динамического обращения один и тот же разделитель,
то становится невозможно различать подобные вызовы:
Foo::bar(&foo); // вызов метода `bar` из `Foo` у объекта `foo`Foo.bazz(&foo); // вызов метода `bazz` у созданного на месте объекта `Foo`
Программа, написанная на Rust, не имеет информации о типах во
время выполнения, так как при компиляции происходит "стирание
типов". Поэтому возникает необходимость различать динамические и
статические обращения: механизм их работы сильно отличается, как и
последствия, к которым они приводят, так что программист должен
видеть это в коде явно. Однако в качестве утешения появляется
возможность использовать одни и те же идентификаторы для имен
переменных и модулей, что очень удобно.
Дженерики
Хотя код с использованием угловых скобок для обозначения
параметров обобщенных типов <T>
выглядит более
"шумно", чем код с использованием квадратных скобок
[T]
, тем не менее в Rust используется вариант с
угловыми скобками, потому что он однозначно отделяет тип от
контекста его использования, тогда как конструкция [T]
сама является обозначением типа (среза).
fn parse<F: FromStr>(&self) -> Result<F, F::Err> { // ...}
Обобщенный метод parse
на вход принимает тип
F
, реализующий типаж FromStr
, и ссылку на
экземпляр объекта &self
, для которого реализуется
данный метод. Возвращает же он обобщенный тип Result
,
в который передаются в качестве параметров типа F
и
ассоциированный с ним тип F::Err
.
Угловые скобки используются для работы с обобщенными типами как
в контексте объявления обобщенных элементов, так и в контексте
выражения при подстановке уже конкретных типов. И с этим связана,
пожалуй, самая уродливая конструкция языка жуткий мутант, внушающий
первобытный страх любому, кто случайно заглядывает в глубины
"синтОксиса" кода на Rust. Имя этому монстру Турбофиш:
"2021".parse::<usize>()
Вот этот страшный зверь ::<>
и есть Турбофиш.
К сожалению оказалось, что от него совсем не просто избавиться:
конструкция A<B>()
выглядела бы логичнее и
лаконичнее, но в контексте выражения парсер не может отличить ее
начало от операции сравнения A < B
. Отсюда и
возникает необходимость дополнить угловую скобку разделителем
сегментов в пути ::
. Турбофиш очень знаменит в
сообществе разработчиков на Rust, и если он когда-нибудь все-таки
будет устранен (что вряд ли), то этот факт опечалит многих людей.
По-своему он прекрасен, и к нему уже все привыкли.
Времена жизни
Имена времен жизни в Rust указываются с префиксом в виде
одинарной кавычки: 'name
. Не всем это нравится, но
данный синтаксис самый лаконичный из всего, что было предложено. До
его введения использовался синтаксис /&name
и
&name/
, который гораздо хуже читается. Идея
синтаксиса 'name
была навеяна тем фактом, что близким
аналогом параметра времени жизни является параметр типа, то есть
указание времени жизни по-факту делает элемент обобщенным:
struct StringReader<'a> { value: &'a str, count: uint}
Идентификаторы с префиксом или суффиксом в виде одинарной
кавычки используются в языках семейства ML. В частности, в OCaml
запись 'name
используется для обозначения переменной
типа в обобщенных конструкциях. Rust продолжает эту традицию.
Кроме того, в Rust нашлось еще одно интересное применение
подобного синтаксиса для задания меток:
'outer: loop { loop { break 'outer; }}
Параллели с временами жизни тут не случайны: предполагалось, что
в будущем в языке появится возможность аннотировать любые блоки
подобными метками, которые будут также служить идентификаторами
времен жизни их содержимого:
'a: { let x: &'a T = ...;}
Сложно сказать, будет ли вообще реализована такая функция в
языке, но если потребность в ней возникнет, то она органично
впишется в существующий синтаксис.
Макросы
Синтаксис описания декларативных макросов справедливо критикуют
за плохую читаемость, хотя сам по себе он довольно простой и
понятный. Требование смешения обычного кода с командами макроса
налагает серьезные ограничения на синтаксис команд и не в пользу
повышения их читаемости. Проблема эта известна, и довольно давно
уже ведутся работы по улучшению системы макросов в рамках
реализации "macros 2.0". Но пока приходится довольствоваться тем,
что есть. Хотя синтаксис макросов действительно часто выглядит
токсично, спасает то, что он крайне минималистичен и прост: имеются
идентификаторы фрагментов $name
и конструкции
повторения $(..)+
, $(..)*
и
$(..)?
. По сути это все.
Отдельно стоит упомянуть синтаксис обращения к макросу
name!
. Он проектировался с целью сделать имена
макросов заметнее в потоке кода, чтобы визуально можно было сразу
отличить вызов макроса от вызова обычной функции. Это важно, так
как макросы расширяют синтаксис языка и принимают в качестве
параметра код с пользовательским синтаксисом, то есть синтаксис
самого выражения, а не его вычисленное значение. Восклицательный
знак хорошо справляется со своей задачей, вызов становится
заметным, но не настолько, чтобы перетянуть на себя все внимание
(как происходит с другими, широкими символами, вроде
@
). Интуитивно восклицательный знак можно воспринимать
как команду активного действия: макрос разворачивается во время
компиляции, тогда как обычная функция остается в этом отношении
пассивной. В похожем отношении восклицательный знак также
используется в языке D при инстанциации шаблонов.
Собираем все вместе
Хорошо, допустим, каждый из элементов синтаксиса относительно
неплох, но как они сочетаются все вместе? Разве их комбинация не
превращает Rust-код в нечитаемое месиво из спецсимволов?
Например:
fn foo<'a, T: FromStr, I: IntoIterator<Item = T>, F: Fn(T) -> bool>( self: &'a Self, first: T, callable: F, iter: I,) -> Result<&'a T, T::Err> { // ...}
На самом деле это действительно большая проблема. Сигнатуры
обобщенных функций с заданными ограничениями, видимо, самые
перегруженные синтаксисом элементы языка Rust. И чтобы справиться с
ними, Rust предлагает различные синтаксические улучшения и особый
сахар, который помогает лучше упорядочить ограничения и скрыть из
виду те аспекты, которые и так достаточно очевидны:
fn foo<T, I>(&self, first: T, callable: impl Fn(T) -> bool, iter: I) -> MyResult<T>where T: FromStr, I: IntoIterator<Item = T>,{ // ...}
Сигнатура метода foo
уже не выглядит настолько
страшно, как в исходном варианте. Она не идеальна, но сравнивая с
тем, что было, все же заметен явный прогресс в улучшении
читаемости. Видно, что алиасы, автовывод времен жизни, сахар для
указания self
, impl Trait
в позиции
аргумента, блок where
и прочее, введены в язык не
случайно и они сильно упрощают чтение действительно сложных мест, с
непростой семантикой.
Заключение
Как видите, синтаксис Rust не так уж и плох. По крайней мере
любой элемент синтаксиса продуман глубже, чем кажется при
поверхностном взгляде и выбран именно таким по веским причинам
соблюдения баланса простоты, единообразия и выразительности. Отчего
же столько негодования и яростных воплей разносится по сети, насчет
"токсичности" синтаксиса Rust? Я думаю главной причиной является
объективная сложность и непривычность концепций, которые скрываются
за этим синтаксисом, а также высокая информативная плотность кода
на Rust. Новичку это вселяет ужас, а опытному Rust-программисту
облегчает жизнь, так как расширяет его возможности, обеспечивает
высокую степень явности и локализованности кода.
Источники