Версия для печати темы
Нажмите сюда для просмотра этой темы в оригинальном формате
Форум программистов > Алгоритмы > Определить, открывающая кавычка, или закрывающая


Автор: Logo 7.9.2010, 22:44
Пишу веб-редактор, с упрощенной разметкой.
Одной из функций будет автоматическая расстановка кавычек, то есть
Код

Пушкин писал Дельвигу: "Жду "Цыганов" и тотчас тисну". => Пушкин писал Дельвигу: «Жду „Цыганов“ и тотчас тисну».


Как, на ваш взгляд, лучше всего определить, открывающая или закрывающая кавычка поставлена?

Автор: ksnk 7.9.2010, 22:52
Цитата(Logo @  7.9.2010,  22:44 Найти цитируемый пост)
Как, на ваш взгляд, лучше всего определить, открывающая или закрывающая кавычка поставлена?

скормить предложение http://www.artlebedev.ru/tools/typograf/  smile У него, вроде, даже какой-то интерфейс публичный есть.

Общее правило - если за кавычкой идет непробельный символ - кавычка открывающая, если пробельный или знак пунктуации - закрывающая. Ну и просчитать открывающие-закрывающие кавычки с начала текста бывает нужно...

Автор: Logo 7.9.2010, 23:02
Жаль, у него код не открыт)

Цитата

Общее правило - если за кавычкой идет непробельный символ - кавычка открывающая, если пробельный или знак пунктуации - закрывающая. Ну и просчитать открывающие-закрывающие кавычки с начала текста бывает нужно... 


Тут есть исключения, например когда предложение начинается с ..., или за закрывающей )

Автор: nmn 8.9.2010, 17:31
надежнее будет считать кавычки

Автор: Logo 8.9.2010, 20:18
Считать конечно стоит, для предотвращения ошибок, но сам по себе подсчет не сможет определить, где открывающая кавычка, а где закрывающая.

Автор: nmn 8.9.2010, 21:36
 smile если считать с 1, то нечетная то открывающая, если четная то закрывающая

Автор: skyboy 8.9.2010, 22:16
Цитата

Сергей сказал: "Наверное, мясо этого "быка" будет вкусным"

В каких позициях, говоришь, открывающие кавычки?

Автор: nmn 8.9.2010, 23:03
хехе, точно, ну тогда придется просматривать весь текст, чтобы сложить кавычки в пары

Автор: Logo 13.9.2010, 16:13
И вот еще - стоит ли использовать конвертацию в промежуточный формат, который и хранить в базе, или не стоит?

Автор: Logo 13.9.2010, 20:37
Наиболее оптимальным кажется правило, если перед кавычкой стоит пробельный символ, ({[, то эта кавычка открывающая, в остальных случаях закрывающая.

Правда при такой обработке, если перед закрывающей кавычкой будет стоять пробел (в нарушение типографских правил), то CMS будет ругатся, однако, возможно, это даже к лучшему. 

UPD: так же открывающей считается кавычка, стоящая в начале текста, и вся последовательность кавычек, следующих за открывающей.

Автор: Polesinskij 1.11.2013, 17:45
они пишуться конечно подстетом четности колисчества, но при редакции повторной одной и той-же ковычки к счетчику четности добавляется единица как я заметил. Я об этом много думал, так-как стопы и старты кодона идентичны по сути ковычкам и их надо считать в особых счетчиках. smile 

Автор: _Y_ 1.11.2013, 21:31
Цитата(Logo @  13.9.2010,  20:37 Найти цитируемый пост)
 если перед кавычкой стоит пробельный символ, ({[, то эта кавычка открывающая

Маленькие добавление: Надо проверять и символы идущие после кавычки. После открывающей ковычки должена стоять буква, цифра или один из разрешенных знаков препинания, в зависимости от языка. Так, в русском, может стоять троеточие, в испанском знак вопроса, судя по всему, и т.д. После закрывающей должен идти пробел или, опять же, один из разрешенных знаков препинания.

Немного особый случай со знаком переноса строки. В обычном тексте кавычка может стоять как до, так и после кода новой строки. Но до только закрывающая, а после только открывающая. Особый это случай потому, что в HTML коде, кроме переноса строки, еще и тэги надо учитывать. При этом какие-то игнорировать, а какие-то (новая строка, горизонтальная линия, и т.п.) обрабатывать так же, как символ новой строки.

Powered by Invision Power Board (http://www.invisionboard.com)
© Invision Power Services (http://www.invisionpower.com)