() С форматированием вытащить просто не получится.
Просто текст можно вытащить функцией БСП:
РаботаС_HTML.ПолучитьПростойТекстИзHTML(Знач ТекстHTML, Знач Кодировка = Неопределено)
Код функции на всякий случай:
// Получает текстовое содержимое ДокументаHTML.
//
Функция ПолучитьПростойТекстИзHTML(Знач ТекстHTML, Знач Кодировка = Неопределено) Экспорт
ТекстHTML = СтрЗаменить(ТекстHTML, "</o:p>", "</o:p>" + Символы.ПС);
ТекстHTML = СтрЗаменить(ТекстHTML, "</o:p>" + Символы.ПС + Символы.ПС, "</o:p>" + Символы.ПС);
ТекстHTML = СтрЗаменить(ТекстHTML, "</p>", "</p>" + Символы.ПС);
ТекстHTML = СтрЗаменить(ТекстHTML, "</p>" + Символы.ПС + Символы.ПС, "</p>" + Символы.ПС);
ТекстHTML = СтрЗаменить(ТекстHTML, "</div>", "</div>" + Символы.ПС);
ТекстHTML = СтрЗаменить(ТекстHTML, "</div>" + Символы.ПС + Символы.ПС, "</div>" + Символы.ПС);
ТекстHTML = СтрЗаменить(ТекстHTML, "", Символы.ПС + Символы.ПС);
Построитель = Новый ПостроительDOM;
ЧтениеHTML = Новый ЧтениеHTML;
Если ЗначениеЗаполнено(Кодировка) Тогда
Попытка
ЧтениеHTML.УстановитьСтроку(ТекстHTML, Кодировка);
Исключение
ЧтениеHTML.УстановитьСтроку(ТекстHTML); // кодировка могла быть некорректная - ставим без кодировки
КонецПопытки;
Иначе
ЧтениеHTML.УстановитьСтроку(ТекстHTML);
КонецЕсли;
ДокументHTML = Построитель.Прочитать(ЧтениеHTML);
Если ДокументHTML.Тело = Неопределено Тогда
Возврат "";
КонецЕсли;
Возврат ДокументHTML.Тело.ТекстовоеСодержимое;
КонецФункции
Показать
Ну или можно попробовать
Функция ПолучитьТекстИзHTML(Знач ТекстHTML, Знач Кодировка = Неопределено, Знач ВыделятьСсылки = Истина) Экспорт
более продвинутая