Skip to content

izvolov/burst

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Burst

То, чего нет в Бусте.

Статус сборки под Linux Статус сборки под macOS Покрытие кода тестами Качество кода Попробовать онлайн на Wandbox.org

О проекте

Стандартная библиотека неплоха, но в ней кое-чего не хватает. Поэтому умные люди написали набор библиотек, которые дополняли бы стандартную тем, чего в ней нет. Однако, и в этих дополнительных библиотеках тоже кое-чего не хватает.

В данном проекте я попытался собрать некоторые алгоритмы и инструменты, совместимые с СБШ и Бустом, которые нужны в повседневной работе, но которых пока нет ни в стандартной библиотеке, ни в библиотеке Boost, либо же они есть, но не устраивают с точки зрения интерфейса или производительности.

Содержание

  1. Что интересного?
    1. Целочисленные сортировки
    2. Динамический кортеж
    3. Ленивые вычисления над диапазонами
  2. Требования
  3. Установка
    1. Вариант 1: Скопировать исходники
    2. Вариант 2: Установить с помощью CMake
    3. Вариант 3: Подключить папку с проектом в CMake
    4. Вариант 4: CMake FetchContent

Что интересного?

Полный список интересных штук можно изучить в справочнике.

Целочисленные сортировки

Алгоритмы сортировок стандартной библиотеки std::sort и std::stable_sort являются классическими представителями сортировок, основанных на сравнениях. В то же время время существует другой класс алгоритмов, применимый к целым числам и не использующий в своей работе сравнения. Таким алгоритмом является поразрядная сортировка. И, хотя это такой же классический алгоритм, как, например, быстрая сортировка или сортировка подсчётом, реализации поразрядной сортировки, как правило, оставляют желать лучшего. Возможно, поэтому многие люди до сих пор считают поразрядку алгоритмом, представляющим исключительно академический интерес, и малоприменимым в реальности. Однако, это заблуждение.

Представленная в данной библиотеке реализация поразрядной сортировки существенно быстрее стандартных std::sort и std::stable_sort (и даже boost::integer_sort) при условии, что сортируются целые числа или доступно отображение из сортируемых элементов в целые числа.

Сравнение сортировок целых чисел

Помимо обычного, существует и многопоточный вариант целочисленных сортировок, который на достаточно больших массивах даёт кратный рост скорости сортировки:

Последовательный и параллельный варианты

Подробнее про burst::radix_sort и burst::counting_sort.

Динамический кортеж

Представьте, что вам нужно сложить в один контейнер объекты разных типов, при этом набор типов неизвестен на этапе компиляции, а объекты должны быть расположены в непрерывной области памяти и плотно упакованы, то есть между ними не должно быть пустот.

Никакая комбинация стандартных средств (tuple, vector, any) не позволяют добиться требуемого результата.

Поэтому был разработан класс burst::dynamic_tuple, удовлетворяющий всем этим требованиям, а соответствие данным требованиям означает оптимальность по занимаемой памяти и времени доступа к нужным объектам.

burst::dynamic_tuple t(std::string("123"));

t.push_back(std::vector<int>{1, 2, 3});
t.push_back(true);
t.push_back(123u);

assert(t.size() == 4);
assert(t.get<std::string>(0) == "123");
assert((t.get<std::vector<int>>(1) == std::vector<int>{1, 2, 3}));
assert(t.get<bool>(2) == true);

t.get<unsigned>(3) = 789u;
assert(t.get<unsigned>(3) == 789u);

Подробнее про burst::dynamic_tuple.

Ленивые вычисления над диапазонами

Периодически возникает потребность в работе с диапазонами как с множествами, то есть производить операции разности, слияния, объединения, пересечения и т.д. Стандартные средства (std::set_intersection и т.д.) умеют работать только с двумя диапазонами одновременно, а кроме того, память, в которую будет записан результат, должен быть известен заранее.

В данной библиотеке реализован ряд алгоритмов, каждый из которых работает с произвольным количеством диапазонов, а результатом является ленивый диапазон, который производит нужную операцию (пересечение, слияние и т.д.) "на лету".

Например, следующим образом можно получить пересечение нескольких диапазонов, причём исходные диапазоны могут быть разного типа:

auto natural = std::vector<int>{1, 2, 3, 4, 5, 6, 7};
auto   prime = std::list<int>  {   2, 3,    5,    7};
auto     odd = std::deque<int> {1,    3,    5,    7};
//                                    ^     ^     ^

auto intersected_range = burst::intersect(std::tie(natural, prime, odd));

auto expected_collection = {3, 5, 7};
assert(intersected_range == expected_collection);

Доступные операции:

  1. Склейка
  2. Слияние
  3. Пересечение
  4. Полупересечение
  5. Объединение
  6. Разность
  7. Симметрическая разность
  8. Разбиение на куски

Подробнее про ленивые вычисления над диапазонами.

Требования

  1. Система сборки CMake версии 3.8.2 и выше;
  2. Компилятор GCC версии 7.3 и выше или компилятор Clang версии 8 и выше1;
  3. Библиотека тестирования doctest [Не обязательно2];
  4. Библиотека Boost (модуль program_options [Не обязательно3], модуль system [Не обязательно4]) версии 1.66 и выше;
  5. Doxygen [Не обязательно].

Заведомо работающие конфигурации перечислены в интеграционных скриптах.

1 При работе с идущей в комплекте libc++ или libstdc++ версии 7 и выше.

2 Можно миновать этап сборки и тестирования, если при сборке с помощью CMake выключить опцию BURST_TESTING:

cmake -DBURST_TESTING=OFF <прочие аргументы ...>

Также тестирование автоматически отключается в случае, если Burst подключается в качестве подпроекта.

Если тестирование всё-таки включено, но doctest отсутствует в системе, то он будет автоматически скачан из репозитория и установлен локально с помощью CMake FetchContent.

3 Boost.Program_options не понадобится, если отключить этап сборки замеров производительности с помощью опции BURST_BENCHMARKING:

cmake -DBURST_BENCHMARKING=OFF <прочие аргументы ...>

Также замеры производительности отключаются в случае, если Burst подключается в качестве подпроекта.

4 Boost.System нужен только при использовании параллельных алгоритмов (например, параллельной версии radix_sort).

Установка

Возможны следующие варианты установки.

Вариант 1: Скопировать исходники

Поскольку Burst — полностью заголовочная библиотека, то достаточно скопировать в нужную директорию все заголовки из папки include из репозитория и подключить их в свой проект.

Вариант 2: Установить с помощью CMake

cd path/to/build/directory
cmake -DCMAKE_BUILD_TYPE=Release path/to/burst
cmake --build . --target install

После этого в системе сборки CMake будет доступен пакет Burst:

find_package(Burst)

Эта команда породит интерфейсную библиотеку Burst::burst, которую можно использовать при подключении библиотек:

add_executable(program program.cpp)
target_link_libraries(program PRIVATE Burst::burst)

Вариант 3: Подключить папку с проектом в CMake

add_subdirectory("path/to/burst")

После этого в системе сборки CMake будет доступна цель Burst::burst, которую можно использовать при подключении библиотек:

add_executable(program program.cpp)
target_link_libraries(program PRIVATE Burst::burst)

Вариант 4: CMake FetchContent

Начиная с версии CMake 3.14 можно скачать и подключить репозиторий с зависимостью прямо во время сборки с помощью модуля FetchContent. В случае с библиотекой Burst это можно записать тремя командами:

include(FetchContent)
FetchContent_Declare(Burst GIT_REPOSITORY https://github.com/izvolov/burst.git)
FetchContent_MakeAvailable(Burst)

Этот набор команд породит интерфейсную библиотеку Burst::burst, которую можно использовать при подключении библиотек:

add_executable(program program.cpp)
target_link_libraries(program PRIVATE Burst::burst)