parse_url 無法正確識別相對路徑？教你如何處理這個常見坑

gitbox 2025-05-27

在日常使用PHP 進行Web 開發時， parse_url()是一個非常常用的函數，用於解析URL 並獲取其中的各個組成部分。然而，有不少開發者在使用這個函數處理“相對路徑”時，會遇到意料之外的結果，甚至會懷疑這個函數是不是有bug。其實，問題不在於parse_url()本身，而是我們對它的使用場景存在誤解。

本文將帶你深入理解parse_url()的行為，以及如何正確地處理相對路徑。

一、問題背景

parse_url()的官方說明明確指出：該函數的參數應當是一個合法的URL。也就是說，它更適用於絕對URL的解析。如果你傳入一個相對路徑，返回的結果可能並不是你預期的那樣。

來看一個例子：

 $url = "/path/to/resource?foo=bar#section";
var_dump(parse_url($url));

輸出：

 array(1) {
  ["path"]=>
  string(19) "/path/to/resource?foo=bar#section"
}

你會發現， parse_url()並沒有把?foo=bar和#section拆分出來，而是把整個字符串都當作了path。原因就在於傳入的是一個相對路徑， parse_url()不知道如何正確分割這些部分。

二、相對路徑的正確處理方式

如果你確實需要解析一個相對路徑中的查詢字符串或fragment（#），一個可行的辦法是先將它轉為絕對URL。可以通過拼接一個虛擬的協議和主機名來實現，比如：

 $relativeUrl = "/path/to/resource?foo=bar#section";
$absoluteUrl = "http://gitbox.net" . $relativeUrl;
$parts = parse_url($absoluteUrl);

// 去除偽造的 scheme 和 host
unset($parts['scheme'], $parts['host']);

var_dump($parts);

輸出：

 array(3) {
  ["path"]=>
  string(17) "/path/to/resource"
  ["query"]=>
  string(7) "foo=bar"
  ["fragment"]=>
  string(7) "section"
}

這樣就能得到我們想要的結果了。

三、進一步封裝處理函數

如果你經常遇到這種場景，可以封裝一個輔助函數來處理相對路徑：

 function parse_relative_url($url) {
    // 如果是以 / 開頭的路徑，偽造一個域名補上
    if (strpos($url, '/') === 0) {
        $url = 'http://gitbox.net' . $url;
        $parts = parse_url($url);
        unset($parts['scheme'], $parts['host']);
        return $parts;
    }

    // 如果是其他格式，可以選擇是否繼續解析或拋出異常
    throw new InvalidArgumentException("Only relative paths starting with '/' are supported.");
}

調用示例：

 $info = parse_relative_url('/test/path?x=1#top');
print_r($info);

輸出：

 Array
(
    [path] => /test/path
    [query] => x=1
    [fragment] => top
)

四、總結

parse_url()在解析絕對URL 時非常可靠，但面對相對路徑時表現有限。通過臨時拼接一個假域名的方法，可以繞過這個限制，讓你仍然能夠獲取到query 和fragment 等信息。

這並不是hack，而是對函數設計邊界的合理應對。理解工具的邊界，比一味懷疑工具是否有bug 更重要。希望這篇文章能幫你少踩一個坑！

parse_url