Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Шевырин Никита #229

Open
wants to merge 22 commits into
base: master
Choose a base branch
from

Conversation

alexadralt
Copy link

No description provided.


public enum MarkdownTokenType
{
NoConversion,

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

Это зачем нужно и где использоваться будет?

{
NoConversion,
ToItalic,
ToBold,

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

По смыслу если это именно тип, то To из названия можно убрать

{
var markdownSpan = markdown.AsSpan();
var context = new StringBuilder();
var stepCount = markdownSpan.Length / _sliceSize;

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

Не очень понял, зачем эта разбивка на куски вообще нужна. Не сломается ли чего если какой-то токен сразу в двух слайсах окажется?


public class Md : IMd
{
private readonly ITokenizer[] _tokenizers =

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

В других домашках ты вроде по-другому приватные поля называл, без _ . В этом проекте всегда так поля называть будем?

var sliceStart = step * _sliceSize;
var sliceSize = Math.Min(_sliceSize, markdownSpan.Length - sliceStart);
var stepSpan = markdownSpan.Slice(sliceStart, sliceSize);
foreach (var tokenizer in _tokenizers)

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

Я предлагаю разделить логику на несколько классов:

  1. Сначала преобразуем текст в набор токенов
  2. Преобразуем набор токенов в другой текст
    А то тяжело как-то следить за тем что вообще происходит

[Description("Тест на производительность")]
public void Render_PerformanceTest()
{
var fullStr = ArrangePerformanceTest("_Hello_ world_12. Hel_lo world_", 20000);

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

Круто что сделал тест на производительность, есть парочка моментов, которые можно было бы улучшить.

  1. Хорошо бы было проверять разные входные данные с разными тегами, экранированием, вложенностью и т.п. Кажется можно задавать параметры где-то перед тестами, напиример в тесткейсе
  2. Хотелось бы на каждом запуске теста проверять скорость рендера не 1 раз, а несколько, и высчитывать среднее значение. Т.к. какие-то запуски могут работать чуть медленнее н-р из-за сборки мусора, или работы каких-то внешних библиотек
  3. Хорошо бы отделить юнит-тесты от нагрузочных, и вынести это в отдельный проект
  4. Общую логику для теста тоже можно вынести в отдельный класс (запуск какого-то метода, измерение его времени и логирование результата). Вдруг будем не только рендер тестировать.

InsideWord = insideWord;
}

public ReadOnlyMemory<char> Text { get; set; }

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

В каких-то классах у тебя поля классов до конструктора прописаны, в каких-то после. Давай одного стиля придерживаться

using Markdown.Tokenizer;

var tokenAliases = new Dictionary<string, MdTokenType>();
tokenAliases.Add("_", MdTokenType.Italic);

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

Может вынесем инициализацию этих объектов в какой-то отдельный класс? Его тогда и в тестах переиспользовать можно будет


namespace Markdown.SyntaxRules;

public class NestingRule : ISyntaxRule<MdTokenType>

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

Не кажется что у NestingRule, TokensInDifferentWordsRule и NumberRule много общего кода, и отличается только одна проверка. Можно ли как-то общий функционал вынести?

input.Slice(plainTextStart, str!.Length - plainTextStart));
}

private bool TryMatchTokenAliases(

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

Можно вместо 3 out переменных какой-нибудь класс создать, и его возвращать, чуть читаемее будет

return true;
}

if (mathcedOpeningToken)

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

Можно вынести в отдельные методы обработки типов токенов


private bool IsWordDelimiter(char c)
{
return c is ' ' or '\t' or '\n' or '\r' or ',' or '.'

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

Это как-будто константой должно быть или где-то извне передаваться

int i = 0;
foreach (var ch in pattern)
{
if (index + i >= input.Length || ch != input[index + i])

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

Мы тут за пределы строки не можем в теории выйти?

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

Successfully merging this pull request may close these issues.

2 participants