То, чего нет в Бусте.
Стандартная библиотека неплоха, но в ней кое-чего не хватает. Поэтому умные люди написали набор библиотек, которые дополняли бы стандартную тем, чего в ней нет. Однако, и в этих дополнительных библиотеках тоже кое-чего не хватает.
В данном проекте я попытался собрать некоторые алгоритмы и инструменты, совместимые с СБШ и Бустом, которые нужны в повседневной работе, но которых пока нет ни в стандартной библиотеке, ни в библиотеке Boost, либо же они есть, но не устраивают с точки зрения интерфейса или производительности.
Полный список интересных штук можно изучить в справочнике.
Алгоритмы сортировок стандартной библиотеки std::sort
и std::stable_sort
являются классическими представителями сортировок, основанных на сравнениях. В то же время время существует другой класс алгоритмов, применимый к целым числам и не использующий в своей работе сравнения. Таким алгоритмом является поразрядная сортировка. И, хотя это такой же классический алгоритм, как, например, быстрая сортировка или сортировка подсчётом, реализации поразрядной сортировки, как правило, оставляют желать лучшего. Возможно, поэтому многие люди до сих пор считают поразрядку алгоритмом, представляющим исключительно академический интерес, и малоприменимым в реальности. Однако, это заблуждение.
Представленная в данной библиотеке реализация поразрядной сортировки существенно быстрее стандартных std::sort
и std::stable_sort
(и даже boost::integer_sort
) при условии, что сортируются целые числа или доступно отображение из сортируемых элементов в целые числа.
Помимо обычного, существует и многопоточный вариант целочисленных сортировок, который на достаточно больших массивах даёт кратный рост скорости сортировки:
Подробнее про burst::radix_sort
и burst::counting_sort
.
Представьте, что вам нужно сложить в один контейнер объекты разных типов, при этом набор типов неизвестен на этапе компиляции, а объекты должны быть расположены в непрерывной области памяти и плотно упакованы, то есть между ними не должно быть пустот.
Никакая комбинация стандартных средств (tuple
, vector
, any
) не позволяют добиться требуемого результата.
Поэтому был разработан класс burst::dynamic_tuple
, удовлетворяющий всем этим требованиям, а соответствие данным требованиям означает оптимальность по занимаемой памяти и времени доступа к нужным объектам.
burst::dynamic_tuple t(std::string("123"));
t.push_back(std::vector<int>{1, 2, 3});
t.push_back(true);
t.push_back(123u);
assert(t.size() == 4);
assert(t.get<std::string>(0) == "123");
assert((t.get<std::vector<int>>(1) == std::vector<int>{1, 2, 3}));
assert(t.get<bool>(2) == true);
t.get<unsigned>(3) = 789u;
assert(t.get<unsigned>(3) == 789u);
Подробнее про burst::dynamic_tuple
.
Периодически возникает потребность в работе с диапазонами как с множествами, то есть производить операции разности, слияния, объединения, пересечения и т.д. Стандартные средства (std::set_intersection
и т.д.) умеют работать только с двумя диапазонами одновременно, а кроме того, память, в которую будет записан результат, должен быть известен заранее.
В данной библиотеке реализован ряд алгоритмов, каждый из которых работает с произвольным количеством диапазонов, а результатом является ленивый диапазон, который производит нужную операцию (пересечение, слияние и т.д.) "на лету".
Например, следующим образом можно получить пересечение нескольких диапазонов, причём исходные диапазоны могут быть разного типа:
auto natural = std::vector<int>{1, 2, 3, 4, 5, 6, 7};
auto prime = std::list<int> { 2, 3, 5, 7};
auto odd = std::deque<int> {1, 3, 5, 7};
// ^ ^ ^
auto intersected_range = burst::intersect(std::tie(natural, prime, odd));
auto expected_collection = {3, 5, 7};
assert(intersected_range == expected_collection);
Доступные операции:
- Склейка
- Слияние
- Пересечение
- Полупересечение
- Объединение
- Разность
- Симметрическая разность
- Разбиение на куски
Подробнее про ленивые вычисления над диапазонами.
- Система сборки CMake версии 3.8.2 и выше;
- Компилятор GCC версии 7.3 и выше или компилятор Clang версии 8 и выше1;
- Библиотека тестирования doctest [Не обязательно2];
- Библиотека Boost (модуль
program_options
[Не обязательно3], модульsystem
[Не обязательно4]) версии 1.66 и выше; - Doxygen [Не обязательно].
Заведомо работающие конфигурации перечислены в интеграционных скриптах.
1 При работе с идущей в комплекте
libc++
илиlibstdc++
версии 7 и выше.
2 Можно миновать этап сборки и тестирования, если при сборке с помощью
CMake
выключить опциюBURST_TESTING
:cmake -DBURST_TESTING=OFF <прочие аргументы ...>Также тестирование автоматически отключается в случае, если Burst подключается в качестве подпроекта.
Если тестирование всё-таки включено, но doctest отсутствует в системе, то он будет автоматически скачан из репозитория и установлен локально с помощью CMake FetchContent.
3
Boost.Program_options
не понадобится, если отключить этап сборки замеров производительности с помощью опцииBURST_BENCHMARKING
:cmake -DBURST_BENCHMARKING=OFF <прочие аргументы ...>Также замеры производительности отключаются в случае, если Burst подключается в качестве подпроекта.
4
Boost.System
нужен только при использовании параллельных алгоритмов (например, параллельной версииradix_sort
).
Возможны следующие варианты установки.
Поскольку Burst — полностью заголовочная библиотека, то достаточно скопировать в нужную директорию все заголовки из папки include
из репозитория и подключить их в свой проект.
cd path/to/build/directory
cmake -DCMAKE_BUILD_TYPE=Release path/to/burst
cmake --build . --target install
После этого в системе сборки CMake будет доступен пакет Burst
:
find_package(Burst)
Эта команда породит интерфейсную библиотеку Burst::burst
, которую можно использовать при подключении библиотек:
add_executable(program program.cpp)
target_link_libraries(program PRIVATE Burst::burst)
add_subdirectory("path/to/burst")
После этого в системе сборки CMake будет доступна цель Burst::burst
, которую можно использовать при подключении библиотек:
add_executable(program program.cpp)
target_link_libraries(program PRIVATE Burst::burst)
Начиная с версии CMake 3.14 можно скачать и подключить репозиторий с зависимостью прямо во время сборки с помощью модуля FetchContent. В случае с библиотекой Burst
это можно записать тремя командами:
include(FetchContent)
FetchContent_Declare(Burst GIT_REPOSITORY https://github.com/izvolov/burst.git)
FetchContent_MakeAvailable(Burst)
Этот набор команд породит интерфейсную библиотеку Burst::burst, которую можно использовать при подключении библиотек:
add_executable(program program.cpp)
target_link_libraries(program PRIVATE Burst::burst)