Рыбин Леонид #236

JavaScriptHaters · 2024-11-24T19:19:44Z

No description provided.

SlavikGh0st · 2024-11-25T06:46:34Z

cs/Markdown/Tokenizer.cs

+public class Tokenizer
+{
+    private Stack<BoldToken> boldTokens;
+    private Stack<ItalicToken> italicTokens;


Представь, что у нас в будущем появиться ещё больше стилей - получается под каждый стиль нужно будет свою коллекцию заводить...
А хотелось бы, чтобы ты просто создавал новый класс токена, что-то в нём описал и передавал этот класс в парсер, а оно более-менее автоматически заводилось.

SlavikGh0st · 2024-11-25T06:56:10Z

cs/Markdown/Tokens/PairToken.cs

+
+    public bool IsClosed { get; set; }
+    public int Position { get; set; }
+}


Как мне кажется, у тебя перемешалась логика токена и тэга:
Класс тэга должен содержать в себе символ тэга, тип, открывающий/закрывающий элемент html.
Класс токена должен содержать в себе исходную строку, преобразованную строку, возможно, позицию.

Идея такая - ты создаешь парсер со списком тэгов, которые он должен обрабатывать/искать, а потом вызываешь метод, в котором передаешь текст, а он тебе возвращает найденные токены. В найденных токенах нас интересует уже готовый "преобразованный" текст.

Я специально не разделял тэг и токен, потому что я вижу работу парсера так:
Парсер идёт по строке, парсер увидел что символ или группа символов подходят под какой-то тип токена (заголовок, курсив и так далее), после этого он добавляет этот токен в общий список токенов(метод Tokenizer), а после при генерации HTML(метод GenerateHtml) токены будут заменяться на тэги, при этом каждый токен уже сам знает на что его заменить и где его заменить. Если же разделить тэги и токены, то процесс замены токена на тэг усложниться, так как появиться дополнительная логика в методе генерации HTML.

SlavikGh0st · 2024-11-25T07:44:48Z

cs/Markdown/Md.cs

+
+    private string RenderCurrentString(string line)
+    {
+        var tokenizer = new Tokenizer(line);


У тебя пока не написана логика, поэтому можешь сказать своё видение, какие токены вернуться для этой строки:

# Hello _world,_ Leo!

В начале строки мы видим "# " поэтому добавляется HeaderToken(HtmlView = <h1>), потом "_" добавляет ItalicToken(HtmlView = <em>), после мы видим "_", но уже закрывающий, благодаря стэкам мы понимаем какой это тип(закрывающий или открывающий), поэтому добавиться ItalicToken(HtmlView = </em>) и наконец мы дойдём до конца строки, поскольку в стэке будет открывающий HeaderToken, то необходимо добавить HeaderToken(HtmlView = </h1>).

Так-с, т.е. в этой строке нам придет список токенов, условно говоря, "какой тэг и в какой позиции".
Я вижу тут 2 проблемы:

Если вдруг понадобиться поддержать тэг <h2> (у него признак окончания тоже конец строки) - такой алгоритм позволит это сделать?

Могут возникнуть сложности при сборке итоговой html-строки из-за смещения позиций: т.е. ты запомнил, что в позиции 9 должен начаться курсив, а в итоговой строке это уже не позиция 9, т.к. "# " мы заменили на "<h1>".

SlavikGh0st · 2024-11-25T15:47:10Z

cs/Markdown/Tags/TagType.cs

@@ -0,0 +1,9 @@
+namespace Markdown.Tags;
+
+public enum TagType


Кажется этот enum-чик лишним, т.к. у тебя уже есть разные реализации ITag - они и отражают тип тэга.

SlavikGh0st · 2024-11-25T15:50:08Z

cs/Markdown/Md.cs

+
+public class Md
+{
+    private readonly List<ITag> availableTags =


Можно всё это статическим сделать - и класс, и этот список.

SlavikGh0st · 2024-11-25T15:56:08Z

cs/Markdown/TagParser.cs

+
+public class TagParser
+{
+    private readonly List<(Stack<ITag>, TagType)> TagsOrder;


Чёт пока сложно как-то тут и непонятно, как это использовать: вроде это должен быть список List<ITag> tags, который наш парсер будет уметь распознавать и уметь конвертировать.

Т.е. чтобы тебе до конца понять, как это ты будешь использовать - необходим какой-то псевдокод, набросочек public List<IToken> GetTokens(string text).

SlavikGh0st · 2024-11-25T16:00:14Z

cs/Markdown/Token/IToken.cs

+
+namespace Markdown.Token;
+
+public interface IToken


Почему интерфейс? Какие реализации будут?

JavaScriptHaters · 2024-11-25T16:37:36Z

cs/Markdown/Md.cs

+    public string Render(string text)
+    {
+        var parser = new TagParser(availableTags);
+        return GenerateHtml(text, parser.GetTokens(text));


Ну если про GetTokens говорить, то он возращает, что-то такое:
"# ", <h1>, position = 0
"_", <em>, position = 8
А GenerateHtml пробегает по тексту и меняет в нужной позиции символы на HTML тэги, при этом у него может быть глобальный сдвиг, чтобы позиции символов оставались актуальными

SlavikGh0st · 2024-12-02T12:39:18Z

cs/MarkdownTests/MarkdownTest.cs

+            yield return new TestCaseData("_\\a_", "<em>\\a</em>").SetName("does not escape the letter");
+            yield return new TestCaseData("_a\\_", "_a_").SetName("shielded closing tag");
+            yield return new TestCaseData("\\__a_", "_<em>a</em>").SetName("shields the bold turning into italic");
+            yield return new TestCaseData("__test \\_ _markdown_ text__ another text", "<strong>test _ <em>markdown</em> text</strong> another text")


Если убрать слэши, то тест вроде как всё равно должен проходить, но не проходит, почему?

SlavikGh0st · 2024-12-02T12:46:34Z

cs/Markdown/TagParser.cs

+
+    private EscapeRule escapeRule = new();
+
+    public bool TryGoNextSymbol(int textPointer, string text)


Статический метод

SlavikGh0st · 2024-12-02T12:49:57Z

cs/Markdown/TagParser.cs

+        new H1Rule()
+    ];
+
+    private EscapeRule escapeRule = new();


SlavikGh0st · 2024-12-02T12:50:14Z

cs/Markdown/TagParser.cs

+
+public class TagParser
+{
+    private List<IRule> Rules =


SlavikGh0st · 2024-12-02T12:51:43Z

cs/Markdown/SymbolStatus.cs

@@ -0,0 +1,15 @@
+namespace Markdown;
+
+public enum SymbolStatus


По код-стайлу обычно enum-чики с большой буквы именуются
Даже в каких-нить системных майкрософтовских либах так сделано

JavaScriptHaters added 2 commits November 25, 2024 00:18

create Markdown architecture

dd6c865

small fix ITokenPosition and Tokenizer

f58bebf

SlavikGh0st reviewed Nov 25, 2024

View reviewed changes

rebuilt architecture

2953301

JavaScriptHaters requested a review from SlavikGh0st November 25, 2024 15:39

SlavikGh0st reviewed Nov 25, 2024

View reviewed changes

JavaScriptHaters added 11 commits November 25, 2024 21:41

small refactor

3098027

base realization

0e78fce

add escape

d954e38

small fixes

ec240a3

raw variant of state machine

7d337ad

non refactor works bold and italic

db4069a

Add tests

8dc7f24

big refactor

71a7e22

all tags work stable

7b4d9db

big refactor

e92b5fc

small refactor

d5ed0a0

JavaScriptHaters requested a review from SlavikGh0st December 2, 2024 06:36

SlavikGh0st reviewed Dec 2, 2024

View reviewed changes

cs/Markdown/TagParser.cs

new H1Rule()

];

private EscapeRule escapeRule = new();

Copy link

SlavikGh0st Dec 2, 2024

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

readonly

SlavikGh0st reviewed Dec 2, 2024

View reviewed changes

cs/Markdown/TagParser.cs

public class TagParser

{

private List<IRule> Rules =

Copy link

SlavikGh0st Dec 2, 2024

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

readonly

SlavikGh0st reviewed Dec 2, 2024

View reviewed changes

small fix bold tag

ea13850

JavaScriptHaters requested a review from SlavikGh0st December 2, 2024 14:56

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Рыбин Леонид #236

Рыбин Леонид #236

JavaScriptHaters commented Nov 24, 2024

SlavikGh0st Nov 25, 2024

SlavikGh0st Nov 25, 2024

JavaScriptHaters Nov 25, 2024

SlavikGh0st Nov 25, 2024

JavaScriptHaters Nov 25, 2024 •

edited

Loading

SlavikGh0st Nov 25, 2024 •

edited

Loading

SlavikGh0st Nov 25, 2024

SlavikGh0st Nov 25, 2024

SlavikGh0st Nov 25, 2024

SlavikGh0st Nov 25, 2024

This comment was marked as resolved.

JavaScriptHaters Nov 25, 2024

SlavikGh0st Dec 2, 2024

SlavikGh0st Dec 2, 2024

SlavikGh0st Dec 2, 2024

SlavikGh0st Dec 2, 2024

SlavikGh0st Dec 2, 2024


		private EscapeRule escapeRule = new();

		public bool TryGoNextSymbol(int textPointer, string text)

Рыбин Леонид #236

Are you sure you want to change the base?

Рыбин Леонид #236

Conversation

JavaScriptHaters commented Nov 24, 2024

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

JavaScriptHaters Nov 25, 2024 • edited Loading

Choose a reason for hiding this comment

SlavikGh0st Nov 25, 2024 • edited Loading

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

This comment was marked as resolved.

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

Choose a reason for hiding this comment

JavaScriptHaters Nov 25, 2024 •

edited

Loading

SlavikGh0st Nov 25, 2024 •

edited

Loading