Версия для печати темы
Нажмите сюда для просмотра этой темы в оригинальном формате |
Форум программистов > Алгоритмы > Определить, открывающая кавычка, или закрывающая |
Автор: Logo 7.9.2010, 22:44 | ||
Пишу веб-редактор, с упрощенной разметкой. Одной из функций будет автоматическая расстановка кавычек, то есть
Как, на ваш взгляд, лучше всего определить, открывающая или закрывающая кавычка поставлена? |
Автор: Logo 7.9.2010, 23:02 | ||
Жаль, у него код не открыт)
Тут есть исключения, например когда предложение начинается с ..., или за закрывающей ) |
Автор: nmn 8.9.2010, 17:31 |
надежнее будет считать кавычки |
Автор: Logo 8.9.2010, 20:18 |
Считать конечно стоит, для предотвращения ошибок, но сам по себе подсчет не сможет определить, где открывающая кавычка, а где закрывающая. |
Автор: nmn 8.9.2010, 21:36 |
![]() |
Автор: skyboy 8.9.2010, 22:16 | ||
В каких позициях, говоришь, открывающие кавычки? |
Автор: nmn 8.9.2010, 23:03 |
хехе, точно, ну тогда придется просматривать весь текст, чтобы сложить кавычки в пары |
Автор: Logo 13.9.2010, 16:13 |
И вот еще - стоит ли использовать конвертацию в промежуточный формат, который и хранить в базе, или не стоит? |
Автор: Logo 13.9.2010, 20:37 |
Наиболее оптимальным кажется правило, если перед кавычкой стоит пробельный символ, ({[, то эта кавычка открывающая, в остальных случаях закрывающая. Правда при такой обработке, если перед закрывающей кавычкой будет стоять пробел (в нарушение типографских правил), то CMS будет ругатся, однако, возможно, это даже к лучшему. UPD: так же открывающей считается кавычка, стоящая в начале текста, и вся последовательность кавычек, следующих за открывающей. |
Автор: Polesinskij 1.11.2013, 17:45 |
они пишуться конечно подстетом четности колисчества, но при редакции повторной одной и той-же ковычки к счетчику четности добавляется единица как я заметил. Я об этом много думал, так-как стопы и старты кодона идентичны по сути ковычкам и их надо считать в особых счетчиках. ![]() |
Автор: _Y_ 1.11.2013, 21:31 | ||
Маленькие добавление: Надо проверять и символы идущие после кавычки. После открывающей ковычки должена стоять буква, цифра или один из разрешенных знаков препинания, в зависимости от языка. Так, в русском, может стоять троеточие, в испанском знак вопроса, судя по всему, и т.д. После закрывающей должен идти пробел или, опять же, один из разрешенных знаков препинания. Немного особый случай со знаком переноса строки. В обычном тексте кавычка может стоять как до, так и после кода новой строки. Но до только закрывающая, а после только открывающая. Особый это случай потому, что в HTML коде, кроме переноса строки, еще и тэги надо учитывать. При этом какие-то игнорировать, а какие-то (новая строка, горизонтальная линия, и т.п.) обрабатывать так же, как символ новой строки. |