2026-03-09 11:37:43 +01:00
12 changed files with 91420 additions and 89495 deletions
--- a/EPG/TV.xml
+++ b/EPG/TV.xml
--- a/M3U8/TV.m3u8
+++ b/M3U8/TV.m3u8
--- a/M3U8/events.m3u8
+++ b/M3U8/events.m3u8
--- a/M3U8/fetch.py
+++ b/M3U8/fetch.py
@ -62,7 +62,7 @@ async def main() -> None:
        asyncio.create_task(streamhub.scrape(network.client)),
        asyncio.create_task(streamsgate.scrape(network.client)),
        asyncio.create_task(strmd.scrape(network.client)),
-        asyncio.create_task(timstreams.scrape(network.client)),
+        # asyncio.create_task(timstreams.scrape(network.client)),
        asyncio.create_task(tvpass.scrape(network.client)),
        asyncio.create_task(watchfooty.scrape(network.client)),
        asyncio.create_task(webcast.scrape(network.client)),
--- a/M3U8/scrapers/pixel.py
+++ b/M3U8/scrapers/pixel.py
@ -1,4 +1,5 @@
 import json
+import re

 from playwright.async_api import async_playwright

@ -48,6 +49,8 @@ async def get_events() -> dict[str, dict[str, str | float]]:

    events = {}

+    pattern = re.compile(r"https?://[^\s'\"]+?\.m3u8(?:\?[^\s'\"]*)?", re.IGNORECASE)
+
    for event in api_data.get("events", []):
        event_dt = Time.from_str(event["date"], timezone="UTC")

@ -63,18 +66,19 @@ async def get_events() -> dict[str, dict[str, str | float]]:
        stream_urls = [(i, f"server{i}URL") for i in range(1, 4)]

        for z, stream_url in stream_urls:
-            if (stream_link := channel_info.get(stream_url)) and stream_link != "null":
-                key = f"[{sport}] {event_name} {z} ({TAG})"
+            if stream_link := channel_info.get(stream_url):
+                if pattern.search(stream_link):
+                    key = f"[{sport}] {event_name} {z} ({TAG})"

-                tvg_id, logo = leagues.get_tvg_info(sport, event_name)
+                    tvg_id, logo = leagues.get_tvg_info(sport, event_name)

-                events[key] = {
-                    "url": stream_link,
-                    "logo": logo,
-                    "base": "https://pixelsport.tv",
-                    "timestamp": now.timestamp(),
-                    "id": tvg_id or "Live.Event.us",
-                }
+                    events[key] = {
+                        "url": stream_link,
+                        "logo": logo,
+                        "base": "https://pixelsport.tv",
+                        "timestamp": now.timestamp(),
+                        "id": tvg_id or "Live.Event.us",
+                    }

    return events

--- a/M3U8/scrapers/roxie.py
+++ b/M3U8/scrapers/roxie.py
@ -57,18 +57,6 @@ async def process_event(
    return match[1]


-async def get_html_data(client: httpx.AsyncClient, url: str) -> bytes:
-    try:
-        r = await client.get(url)
-        r.raise_for_status()
-    except Exception as e:
-        log.error(f'Failed to fetch "{url}": {e}')
-
-        return b""
-
-    return r.content
-
-
 async def refresh_html_cache(
    client: httpx.AsyncClient,
    url: str,
@ -76,9 +64,15 @@ async def refresh_html_cache(
    now_ts: float,
 ) -> dict[str, dict[str, str | float]]:

-    html_data = await get_html_data(client, url)
+    try:
+        r = await client.get(url)
+        r.raise_for_status()
+    except Exception as e:
+        log.error(f'Failed to fetch "{url}": {e}')

-    soup = HTMLParser(html_data)
+        return {}
+
+    soup = HTMLParser(r.content)

    events = {}

@ -114,15 +108,16 @@ async def refresh_html_cache(


 async def get_events(
-    client: httpx.AsyncClient, cached_keys: set[str]
+    client: httpx.AsyncClient,
+    sport_urls: dict[str, str],
+    cached_keys: set[str],
 ) -> list[dict[str, str]]:
+
    now = Time.clean(Time.now())

    if not (events := HTML_CACHE.load()):
        log.info("Refreshing HTML cache")

-        sport_urls = {sport: urljoin(BASE_URL, sport) for sport in SPORT_ENDPOINTS}
-
        tasks = [
            refresh_html_cache(
                client,
@ -165,7 +160,13 @@ async def scrape(client: httpx.AsyncClient) -> None:

    log.info(f'Scraping from "{BASE_URL}"')

-    events = await get_events(client, set(cached_urls.keys()))
+    sport_urls = {sport: urljoin(BASE_URL, sport) for sport in SPORT_ENDPOINTS}
+
+    events = await get_events(
+        client,
+        sport_urls,
+        set(cached_urls.keys()),
+    )

    log.info(f"Processing {len(events)} new URL(s)")

--- a/M3U8/scrapers/shark.py
+++ b/M3U8/scrapers/shark.py
@ -47,6 +47,7 @@ async def process_event(
 async def refresh_html_cache(
    client: httpx.AsyncClient, now_ts: float
 ) -> dict[str, dict[str, str | float]]:
+
    log.info("Refreshing HTML cache")

    try:
--- a/M3U8/scrapers/sport9.py
+++ b/M3U8/scrapers/sport9.py
@ -29,7 +29,7 @@ async def get_html_data(
        r = await client.get(url, params={"date": date})
        r.raise_for_status()
    except Exception as e:
-        log.error(f'Failed to fetch "{r.url}": {e}')
+        log.error(f'Failed to fetch "{url}": {e}')

        return b""

--- a/M3U8/scrapers/streamcenter.py
+++ b/M3U8/scrapers/streamcenter.py
@ -42,7 +42,7 @@ async def refresh_api_cache(
        r = await client.get(BASE_URL, params={"pageNumber": 1, "pageSize": 500})
        r.raise_for_status()
    except Exception as e:
-        log.error(f'Failed to fetch "{r.url}": {e}')
+        log.error(f'Failed to fetch "{BASE_URL}": {e}')

        return []

--- a/M3U8/scrapers/streamfree.py
+++ b/M3U8/scrapers/streamfree.py
@ -17,10 +17,12 @@ BASE_URL = "https://streamfree.to/"

 async def refresh_api_cache(client: httpx.AsyncClient) -> dict[str, dict[str, list]]:
    try:
-        r = await client.get(urljoin(BASE_URL, "streams"))
+        url = urljoin(BASE_URL, "streams")
+
+        r = await client.get(url)
        r.raise_for_status()
    except Exception as e:
-        log.error(f'Failed to fetch "{r.url}": {e}')
+        log.error(f'Failed to fetch "{url}": {e}')

        return {}

--- a/M3U8/scrapers/streamhub.py
+++ b/M3U8/scrapers/streamhub.py
@ -1,6 +1,5 @@
 import asyncio
 from functools import partial
-from urllib.parse import urljoin

 import httpx
 from playwright.async_api import async_playwright
@ -16,9 +15,7 @@ TAG = "STRMHUB"

 CACHE_FILE = Cache(f"{TAG.lower()}.json", exp=10_800)

-HTML_CACHE = Cache(f"{TAG.lower()}-html.json", exp=28_800)
-
-BASE_URL = "https://streamhub.pro/"
+BASE_URL = "https://streamhub.pro/live-now"


 CATEGORIES = {
@ -36,126 +33,69 @@ CATEGORIES = {
 }


-async def get_html_data(
-    client: httpx.AsyncClient,
-    date: str,
-    sport_id: str,
-) -> bytes:
-
+async def get_html_data(client: httpx.AsyncClient, sport: str) -> bytes:
    try:
-        r = await client.get(
-            urljoin(BASE_URL, f"events/{date}"),
-            params={"sport_id": sport_id},
-        )
-
+        r = await client.get(BASE_URL, params={"sport_id": sport})
        r.raise_for_status()
    except Exception as e:
-        log.error(f'Failed to fetch "{r.url}": {e}')
+        log.error(f'Failed to fetch "{BASE_URL}": {e}')

        return b""

    return r.content


-async def refresh_html_cache(
-    client: httpx.AsyncClient,
-    date: str,
-    sport_id: str,
-    ts: float,
-) -> dict[str, dict[str, str | float]]:
+async def get_events(
+    client: httpx.AsyncClient, cached_keys: set[str]
+) -> list[dict[str, str]]:

-    html_data = await get_html_data(client, date, sport_id)
+    tasks = [get_html_data(client, sport) for sport in CATEGORIES.values()]

-    soup = HTMLParser(html_data)
+    results = await asyncio.gather(*tasks)

-    events = {}
+    soups = [HTMLParser(html) for html in results]

-    for section in soup.css(".events-section"):
-        if not (sport_node := section.css_first(".section-titlte")):
-            continue
+    events = []

-        sport = sport_node.text(strip=True)
-
-        logo = section.css_first(".league-icon img").attributes.get("src")
-
-        for event in section.css(".section-event"):
-            event_name = "Live Event"
-
-            if teams := event.css_first(".event-competitors"):
-                home, away = teams.text(strip=True).split("vs.")
-
-                event_name = f"{away} vs {home}"
-
-            if not (event_button := event.css_first(".event-button a")) or not (
-                href := event_button.attributes.get("href")
-            ):
+    for soup in soups:
+        for section in soup.css(".events-section"):
+            if not (sport_node := section.css_first(".section-titlte")):
                continue

-            event_date = event.css_first(".event-countdown").attributes.get(
-                "data-start"
-            )
+            sport = sport_node.text(strip=True)

-            event_dt = Time.from_str(event_date, timezone="UTC")
+            logo = section.css_first(".league-icon img").attributes.get("src")

-            key = f"[{sport}] {event_name} ({TAG})"
+            for event in section.css(".section-event"):
+                event_name = "Live Event"

-            events[key] = {
-                "sport": sport,
-                "event": event_name,
-                "link": href,
-                "logo": logo,
-                "timestamp": ts,
-                "event_ts": event_dt.timestamp(),
-            }
+                if teams := event.css_first(".event-competitors"):
+                    home, away = teams.text(strip=True).split("vs.")
+
+                    event_name = f"{away} vs {home}"
+
+                if not (event_button := event.css_first("div.event-button a")) or not (
+                    href := event_button.attributes.get("href")
+                ):
+                    continue
+
+                key = f"[{sport}] {event_name} ({TAG})"
+
+                if cached_keys & {key}:
+                    continue
+
+                events.append(
+                    {
+                        "sport": sport,
+                        "event": event_name,
+                        "link": href,
+                        "logo": logo,
+                    }
+                )

    return events


-async def get_events(
-    client: httpx.AsyncClient,
-    cached_keys: set[str],
-) -> list[dict[str, str]]:
-    now = Time.clean(Time.now())
-
-    if not (events := HTML_CACHE.load()):
-        log.info("Refreshing HTML cache")
-
-        dates = [now.date(), now.delta(days=1).date()]
-
-        tasks = [
-            refresh_html_cache(
-                client,
-                date,
-                sport_id,
-                now.timestamp(),
-            )
-            for date in dates
-            for sport_id in CATEGORIES.values()
-        ]
-
-        results = await asyncio.gather(*tasks)
-
-        events = {k: v for data in results for k, v in data.items()}
-
-        HTML_CACHE.write(events)
-
-    live = []
-
-    start_ts = now.delta(hours=-1).timestamp()
-    end_ts = now.delta(minutes=5).timestamp()
-
-    for k, v in events.items():
-        if cached_keys & {k}:
-            continue
-
-        if not start_ts <= v["event_ts"] <= end_ts:
-            continue
-
-        live.append({**v})
-
-    return live
-
-
 async def scrape(client: httpx.AsyncClient) -> None:
    cached_urls = CACHE_FILE.load()
    valid_urls = {k: v for k, v in cached_urls.items() if v["url"]}
@ -171,6 +111,8 @@ async def scrape(client: httpx.AsyncClient) -> None:
    log.info(f"Processing {len(events)} new URL(s)")

    if events:
+        now = Time.now().timestamp()
+
        async with async_playwright() as p:
            browser, context = await network.browser(p)

@ -190,12 +132,11 @@ async def scrape(client: httpx.AsyncClient) -> None:
                    log=log,
                )

-                sport, event, logo, link, ts = (
+                sport, event, logo, link = (
                    ev["sport"],
                    ev["event"],
                    ev["logo"],
                    ev["link"],
-                    ev["event_ts"],
                )

                key = f"[{sport}] {event} ({TAG})"
@ -206,7 +147,7 @@ async def scrape(client: httpx.AsyncClient) -> None:
                    "url": url,
                    "logo": logo or pic,
                    "base": "https://storytrench.net/",
-                    "timestamp": ts,
+                    "timestamp": now,
                    "id": tvg_id or "Live.Event.us",
                    "link": link,
                }
--- a/readme.md
+++ b/readme.md
@ -1,10 +1,12 @@
-## Base Log @ 2025-12-15 20:44 UTC
+## Base Log @ 2025-12-14 20:40 UTC

-### ✅ Working Streams: 145<br>❌ Dead Streams: 1
+### ✅ Working Streams: 143<br>❌ Dead Streams: 3

 | Channel | Error (Code) | Link |
 | ------- | ------------ | ---- |
 | FDSN Florida | HTTP Error (403) | `http://cord-cutter.net:8080/k4Svp2/645504/46794` |
+| Spectrum SportsNet LA Dodgers | HTTP Error (502) | `http://cord-cutter.net:8080/k4Svp2/645504/31636` |
+| getTV | HTTP Error (403) | `http://cord-cutter.net:8080/k4Svp2/645504/18366` |
 ---
 #### Base Channels URL
 ```