Strip html из строки Ruby on Rails

Question

Strip html из строки Ruby on Rails

Я работаю с Ruby on Rails, есть ли способ раздеться html из строки с использованием метода sanitize или equal и сохранить только текст внутри атрибута значения на входном теге?

602 6

html string ruby ruby-on-rails-3

6 ответов:

Comments

Ничего не найдено.

Michael Kohl · Accepted Answer · 2011-09-14 12:49:36

здесь strip_tags метод ActionView::Helpers::SanitizeHelper:

http://api.rubyonrails.org/classes/ActionView/Helpers/SanitizeHelper.html#method-i-strip_tags

Edit: для получения текста внутри атрибута value вы можете использовать что-то вроде Nokogiri с выражением Xpath, чтобы получить это из строки.

Jon · Accepted Answer · 2012-10-17 20:28:15

Если мы хотим использовать эту модель
ActionView::Base.full_sanitizer.sanitize(html_string)
который является кодом в методе "strip_tags"

bcackerman · Accepted Answer · 2018-08-02 17:51:11

да, называю это: sanitize(html_string, tags:[])

Satishakumar Awati · Accepted Answer · 2015-07-02 12:07:30

ActionView::Base.full_sanitizer.sanitize(html_string)
белый список тегов и атрибутов можно указать ниже
ActionView::Base.full_sanitizer.sanitize(html_string, :tags => %w(img br p), :attributes => %w(src style))
выше оператор позволяет теги: img, br и p и атрибуты : src и стиль.

Krishna Vedula · Accepted Answer · 2017-10-02 10:15:46

я использовал библиотеку Loofah, так как она подходит как для HTML, так и для XML (как для документов, так и для фрагментов строк). Это двигатель за html дезинфицирующее жемчужина. Я просто вставляю пример кода, чтобы показать, насколько он прост в использовании.

Люфы
unsafe_html = "ohai! <div>div is safe</div> <script>but script is not</script>"

doc = Loofah.fragment(unsafe_html).scrub!(:strip)
doc.to_s    # => "ohai! <div>div is safe</div> "
doc.text    # => "ohai! div is safe "

josetapadas · Accepted Answer · 2015-09-08 22:14:16

Как насчет этого?

white_list_sanitizer = Rails::Html::WhiteListSanitizer.new
WHITELIST = ['p','b','h1','h2','h3','h4','h5','h6','li','ul','ol','small','i','u']


[Your, Models, Here].each do |klass| 
  klass.all.each do |ob| 
    klass.attribute_names.each do |attrs|
      if ob.send(attrs).is_a? String
        ob.send("#{attrs}=", white_list_sanitizer.sanitize(ob.send(attrs), tags: WHITELIST, attributes: %w(id style)).gsub(/<p>\s*<\/p>\r\n/im, ''))
        ob.save
      end
    end
  end
end