更正link处理逻辑

2025-04-19 11:42:43 +00:00 · 2024-01-19 15:31:13 +08:00 · 2024-01-19 15:31:13 +08:00 · 7b1d7701c6
commit 7b1d7701c6
parent db2813cb6f
1 changed files with 58 additions and 77 deletions
--- a/github-release.py
+++ b/github-release.py
@ -21,21 +21,20 @@ REPOS = []
 TIMEOUT_OPTION = (7, 10)
 total_size = 0

-
-def sizeof_fmt(num, suffix="iB"):
-    for unit in ["", "K", "M", "G", "T", "P", "E", "Z"]:
+def sizeof_fmt(num, suffix='iB'):
+    for unit in ['','K','M','G','T','P','E','Z']:
        if abs(num) < 1024.0:
            return "%3.2f%s%s" % (num, unit, suffix)
        num /= 1024.0
-    return "%.2f%s%s" % (num, "Y", suffix)
-
+    return "%.2f%s%s" % (num, 'Y', suffix)

 # wrap around requests.get to use token if available
 def github_get(*args, **kwargs):
-    headers = kwargs["headers"] if "headers" in kwargs else {}
-    if "GITHUB_TOKEN" in os.environ:
-        headers["Authorization"] = "token {}".format(os.environ["GITHUB_TOKEN"])
-    kwargs["headers"] = headers
+    headers = kwargs['headers'] if 'headers' in kwargs else {}
+    if 'GITHUB_TOKEN' in os.environ:
+        headers['Authorization'] = 'token {}'.format(
+            os.environ['GITHUB_TOKEN'])
+    kwargs['headers'] = headers
    return requests.get(*args, **kwargs)


@ -45,12 +44,7 @@ def do_download(remote_url: str, dst_file: Path, remote_ts: float, remote_size:
        r.raise_for_status()
        tmp_dst_file = None
        try:
-            with tempfile.NamedTemporaryFile(
-                prefix="." + dst_file.name + ".",
-                suffix=".tmp",
-                dir=dst_file.parent,
-                delete=False,
-            ) as f:
+            with tempfile.NamedTemporaryFile(prefix="." + dst_file.name + ".", suffix=".tmp", dir=dst_file.parent, delete=False) as f:
                tmp_dst_file = Path(f.name)
                for chunk in r.iter_content(chunk_size=1024**2):
                    if chunk:  # filter out keep-alive new chunks
@ -59,9 +53,7 @@ def do_download(remote_url: str, dst_file: Path, remote_ts: float, remote_size:
            # check for downloaded size
            downloaded_size = tmp_dst_file.stat().st_size
            if remote_size != -1 and downloaded_size != remote_size:
-                raise Exception(
-                    f"File {dst_file.as_posix()} size mismatch: downloaded {downloaded_size} bytes, expected {remote_size} bytes"
-                )
+                raise Exception(f'File {dst_file.as_posix()} size mismatch: downloaded {downloaded_size} bytes, expected {remote_size} bytes')
            os.utime(tmp_dst_file, (remote_ts, remote_ts))
            tmp_dst_file.chmod(0o644)
            tmp_dst_file.replace(dst_file)
@ -79,7 +71,8 @@ def downloading_worker(q):

        url, dst_file, working_dir, updated, remote_size = item

-        print("downloading", url, "to", dst_file.relative_to(working_dir), flush=True)
+        print("downloading", url, "to",
+              dst_file.relative_to(working_dir), flush=True)
        try:
            do_download(url, dst_file, updated, remote_size)
        except Exception:
@ -93,35 +86,30 @@ def downloading_worker(q):
 def create_workers(n):
    task_queue = queue.Queue()
    for i in range(n):
-        t = threading.Thread(target=downloading_worker, args=(task_queue,))
+        t = threading.Thread(target=downloading_worker, args=(task_queue, ))
        t.start()
    return task_queue


 def ensure_safe_name(filename):
-    filename = filename.replace("\0", " ")
-    if filename == ".":
-        return " ."
-    elif filename == "..":
-        return ". ."
+    filename = filename.replace('\0', ' ')
+    if filename == '.':
+        return ' .'
+    elif filename == '..':
+        return '. .'
    else:
-        return filename.replace("/", "\\").replace("\\", "_")
+        return filename.replace('/', '\\').replace('\\', '_')


 def main():
    import argparse
-
    parser = argparse.ArgumentParser()
    parser.add_argument("--base-url", default=BASE_URL)
    parser.add_argument("--working-dir", default=WORKING_DIR)
-    parser.add_argument(
-        "--workers", default=1, type=int, help="number of concurrent downloading jobs"
-    )
-    parser.add_argument(
-        "--fast-skip",
-        action="store_true",
-        help="do not verify size and timestamp of existing files",
-    )
+    parser.add_argument("--workers", default=1, type=int,
+                        help='number of concurrent downloading jobs')
+    parser.add_argument("--fast-skip", action='store_true',
+                        help='do not verify size and timestamp of existing files')
    parser.add_argument("--config", default=CONFIG)
    args = parser.parse_args()

@ -136,15 +124,14 @@ def main():
    with open(args.config, "r") as f:
        REPOS = json.load(f)

-    def download(release, release_dir, tarball=False):
+    def download(release, release_dir, tarball = False):
        global total_size

        if tarball:
-            url = release["tarball_url"]
+            url = release['tarball_url']
            updated = datetime.strptime(
-                release["published_at"], "%Y-%m-%dT%H:%M:%SZ"
-            ).timestamp()
-            dst_file = release_dir / "repo-snapshot.tar.gz"
+                release['published_at'], '%Y-%m-%dT%H:%M:%SZ').timestamp()
+            dst_file = release_dir / 'repo-snapshot.tar.gz'
            remote_filelist.append(dst_file.relative_to(working_dir))

            if dst_file.is_file():
@ -154,21 +141,19 @@ def main():
                # tarball has no size information, use -1 to skip size check
                task_queue.put((url, dst_file, working_dir, updated, -1))

-        for asset in release["assets"]:
-            url = asset["browser_download_url"]
+        for asset in release['assets']:
+            url = asset['browser_download_url']
            updated = datetime.strptime(
-                asset["updated_at"], "%Y-%m-%dT%H:%M:%SZ"
-            ).timestamp()
-            dst_file = release_dir / ensure_safe_name(asset["name"])
+                asset['updated_at'], '%Y-%m-%dT%H:%M:%SZ').timestamp()
+            dst_file = release_dir / ensure_safe_name(asset['name'])
            remote_filelist.append(dst_file.relative_to(working_dir))
-            remote_size = asset["size"]
+            remote_size = asset['size']
            total_size += remote_size

            if dst_file.is_file():
                if args.fast_skip:
-                    print(
-                        "fast skipping", dst_file.relative_to(working_dir), flush=True
-                    )
+                    print("fast skipping", dst_file.relative_to(
+                        working_dir), flush=True)
                    continue
                else:
                    stat = dst_file.stat()
@ -176,12 +161,10 @@ def main():
                    local_mtime = stat.st_mtime
                    # print(f"{local_filesize} vs {asset['size']}")
                    # print(f"{local_mtime} vs {updated}")
-                    if (
-                        local_mtime > updated
-                        or remote_size == local_filesize
-                        and local_mtime == updated
-                    ):
-                        print("skipping", dst_file.relative_to(working_dir), flush=True)
+                    if local_mtime > updated or \
+                        remote_size == local_filesize and local_mtime == updated:
+                        print("skipping", dst_file.relative_to(
+                            working_dir), flush=True)
                        continue
            else:
                dst_file.parent.mkdir(parents=True, exist_ok=True)
@ -199,10 +182,10 @@ def main():
            pass

    for cfg in REPOS:
-        flat = False  # build a folder for each release
-        versions = 1  # keep only one release
-        tarball = False  # do not download the tarball
-        prerelease = False  # filter out pre-releases
+        flat = False # build a folder for each release
+        versions = 1 # keep only one release
+        tarball = False # do not download the tarball
+        prerelease = False # filter out pre-releases
        if isinstance(cfg, str):
            repo = cfg
        else:
@ -221,26 +204,25 @@ def main():

        try:
            headers = {"Accept": "application/vnd.github+json"}
-            r = github_get(
-                f"{args.base_url}{repo}/releases?per_page=100", headers=headers
-            )
-            r.raise_for_status()
-            releases = r.json()
-
-            next_url = r.headers["link"]
-            if next_url:
-                for url_str in next_url.split(","):
-                    r = github_get(url_str.split(";")[0].strip()[1:-1], headers=headers)
-                    r.raise_for_status()
-                    releases.extend(r.json())
+            releases = []
+            url_str = f"{args.base_url}{repo}/releases"
+            while url_str:
+                r = github_get(url_str, headers=headers)
+                r.raise_for_status()
+                releases.extend(r.json())
+                next_url = [ s.split(";")[0].strip()[1:-1] for s in r.headers["link"].split(",") if s.split(";")[1].strip() == 'rel="next"' ]
+                if next_url:
+                    url_str = next_url[0]
+                else:
+                    url_str = None
        except:
            traceback.print_exc()
            break

        n_downloaded = 0
        for release in releases:
-            if not release["draft"] and (prerelease or not release["prerelease"]):
-                name = ensure_safe_name(release["name"] or release["tag_name"])
+            if not release['draft'] and (prerelease or not release['prerelease']):
+                name = ensure_safe_name(release['name'] or release['tag_name'])
                if len(name) == 0:
                    print("Error: Unnamed release")
                    continue
@ -265,7 +247,7 @@ def main():

    if cleaning:
        local_filelist = []
-        for local_file in working_dir.glob("**/*"):
+        for local_file in working_dir.glob('**/*'):
            if local_file.is_file():
                local_filelist.append(local_file.relative_to(working_dir))

@ -274,7 +256,7 @@ def main():
            old_file = working_dir / old_file
            old_file.unlink()

-        for local_dir in working_dir.glob("*/*/*"):
+        for local_dir in working_dir.glob('*/*/*'):
            if local_dir.is_dir():
                try:
                    # remove empty dirs only
@ -284,7 +266,6 @@ def main():

        print("Total size is", sizeof_fmt(total_size, suffix=""))

-
 if __name__ == "__main__":
    main()