Как сделать декодирование URL в Java?
в Java, я хочу, чтобы преобразовать это:
https%3A%2F%2Fmywebsite%2Fdocs%2Fenglish%2Fsite%2Fmybook.do%3Frequest_type
для этого:
https://mywebsite/docs/english/site/mybook.do&request_type
это то, что у меня есть до сих пор:
class StringUTF
{
public static void main(String[] args)
{
try{
String url =
"https%3A%2F%2Fmywebsite%2Fdocs%2Fenglish%2Fsite%2Fmybook.do" +
"%3Frequest_type%3D%26type%3Dprivate";
System.out.println(url+"Hello World!------->" +
new String(url.getBytes("UTF-8"),"ASCII"));
}
catch(Exception E){
}
}
}
но это не работает правильно. Что это такое %3A и %2F форматы называются и как их конвертировать?
9 ответов:
Это не имеет ничего общего с кодировками, такими как UTF-8 или ASCII. Строка у вас есть URL закодирован. Этот вид кодирования является чем-то совершенно отличным от кодирования символов.
попробуйте что-то вроде этого:
String result = java.net.URLDecoder.decode(url, "UTF-8");обратите внимание, что a кодировка (например, UTF-8 или ASCII) - это то, что определяет отображение символов в необработанные байты. Хорошее введение в кодировку символов см. В разделе этот статья.
строка у вас есть в
application/x-www-form-urlencodedкодировка.использовать URLDecoder чтобы преобразовать его в строку Java.
URLDecoder.decode( url, "UTF-8" );
ответ до (хотя этот вопрос был первым!):
" вы должны использовать java.net.URI для этого, так как класс URLDecoder выполняет декодирование x-www-form-urlencoded, что неверно (несмотря на имя, это для данных формы)."
по сути:
String url = "https%3A%2F%2Fmywebsite%2Fdocs%2Fenglish%2Fsite%2Fmybook.do%3Frequest_type"; System.out.println(new java.net.URI(url).getPath());даст вам:
https://mywebsite/docs/english/site/mybook.do?request_type
%3Aи%2Fпредставляют собой url-закодированные символы. Используйте этот код Java, чтобы преобразовать их обратно в:и/String decoded = java.net.URLDecoder.decode(url, "UTF-8");
try { String result = URLDecoder.decode(urlString, "UTF-8"); } catch (UnsupportedEncodingException e) { // TODO Auto-generated catch block e.printStackTrace(); }
Я использую Апач Коммонс
String decodedUrl = new URLCodec().decode(url);кодировка по умолчанию -
UTF-8
public String decodeString(String URL) { String urlString=""; try { urlString = URLDecoder.decode(URL,"UTF-8"); } catch (UnsupportedEncodingException e) { // TODO Auto-generated catch block } return urlString; }
import java.io.UnsupportedEncodingException; import java.net.URISyntaxException; public class URLDecoding { String decoded = ""; public String decodeMethod(String url) throws UnsupportedEncodingException { decoded = java.net.URLDecoder.decode(url, "UTF-8"); return decoded; //"You should use java.net.URI to do this, as the URLDecoder class does x-www-form-urlencoded decoding which is wrong (despite the name, it's for form data)." } public String getPathMethod(String url) throws URISyntaxException { decoded = new java.net.URI(url).getPath(); return decoded; } public static void main(String[] args) throws UnsupportedEncodingException, URISyntaxException { System.out.println(" Here is your Decoded url with decode method : "+ new URLDecoding().decodeMethod("https%3A%2F%2Fmywebsite%2Fdocs%2Fenglish%2Fsite%2Fmybook.do%3Frequest_type")); System.out.println("Here is your Decoded url with getPath method : "+ new URLDecoding().getPathMethod("https%3A%2F%2Fmywebsite%2Fdocs%2Fenglish%2Fsite%2Fmybook.do%3Frequest")); } }вы можете выбрать свой метод мудро :)
просто используя
URLDecoder.decodeодного раза будет недостаточно .например :
поскольку один и тот же URL-адрес может быть закодирован несколько раз, нам нужно декодировать его до тех пор, пока URL-адрес не будет декодирован дальше. Например, "video%252Fmp4" является результатом двух кодировок. После декодирования его один раз, мы получаем "видео%2Fmp4". Теперь URL-адрес должен быть дополнительно декодирован, чтобы мы получили "video / mp4", что является результатом.
вот код, который работает для всех подобных случаев :
public static String decode(String url) { try { String prevURL=""; String decodeURL=url; while(!prevURL.equals(decodeURL)) { prevURL=decodeURL; decodeURL=URLDecoder.decode( decodeURL, "UTF-8" ); } return decodeURL; } catch (UnsupportedEncodingException e) { return "Issue while decoding" +e.getMessage(); } }
Comments