ब्राउज़र = मेकेनाइक। ब्रॉसर () पृष्ठ = ब्राउज़र.ओपेन (यूआरएल) html = page.get_data () प्रिंट Html
यह कुछ अजीब अक्षर दिखाता है मुझे लगता है कि यह UTF-8 स्ट्रिंग है, लेकिन पायथन यह नहीं जानता है और इसे ठीक से नहीं दिखा सकता है।
मैं कैसे इस स्ट्रिंग को यूनिकोड स्ट्रिंग जैसे
यू = U'test '
यह जिप्प किया गया था
डीएफ़ यूनजीप रिस्पॉन्स (आर, बी): हैडर = आर.एन.ई.ओ. () अगर हेडर ['कंटेंट-एन्कोडिंग'] == 'जीजीआईपी': आयात जीज़िप जीज़ = जीज़िप। जीज़फ़फ़ाइल (फाइलोबज = आर, मोड = 'आरबी') एचटीएमएल = Gz.read () gz.close () हेडर ["सामग्री-प्रकार"] = "पाठ / html; वर्णसेट = यूटीएफ -8" आर.सेट_डेटा (एचटीएमएल) बी.सेट_ आरस्पेंस (आर) प्रतिक्रिया = ब्राउज़र.ओपेन (यूआरएल) ) UngzipResponse (प्रतिक्रिया, ब्राउज़र) html = response.read ()
Comments
Post a Comment