open-webui/backend/open_webui/retrieval/web/duckduckgo.py

import logging
from typing import Optional

from open_webui.retrieval.web.main import SearchResult, get_filtered_results
from ddgs import DDGS
from ddgs.exceptions import RatelimitException
from open_webui.env import SRC_LOG_LEVELS

log = logging.getLogger(__name__)
log.setLevel(SRC_LOG_LEVELS["RAG"])


def search_duckduckgo(
    query: str,
    count: int,
    filter_list: Optional[list[str]] = None,
    concurrent_requests: Optional[int] = None,
) -> list[SearchResult]:
    """
    Search using DuckDuckGo's Search API and return the results as a list of SearchResult objects.
    Args:
        query (str): The query to search for
        count (int): The number of results to return

    Returns:
        list[SearchResult]: A list of search results
    """
    # Use the DDGS context manager to create a DDGS object
    search_results = []
    with DDGS() as ddgs:
        if concurrent_requests:
            ddgs.threads = concurrent_requests

        # Use the ddgs.text() method to perform the search
        try:
            search_results = ddgs.text(
                query, safesearch="moderate", max_results=count, backend="lite"
            )
        except RatelimitException as e:
            log.error(f"RatelimitException: {e}")
    if filter_list:
        search_results = get_filtered_results(search_results, filter_list)

    # Return the list of search results
    return [
        SearchResult(
            link=result["href"],
            title=result.get("title"),
            snippet=result.get("body"),
        )
        for result in search_results
    ]
feat: add DuckDuckGo search functionality using duckduckgo_search library 2024-06-11 22:19:08 +08:00			`import logging`
remove List imports 2024-08-14 20:46:31 +08:00			`from typing import Optional`
sort and fix backend imports 2024-08-28 06:10:27 +08:00
wip: retrieval 2024-12-12 10:05:42 +08:00			`from open_webui.retrieval.web.main import SearchResult, get_filtered_results`
refac 2025-07-07 19:56:05 +08:00			`from ddgs import DDGS`
			`from ddgs.exceptions import RatelimitException`
refac: mv backend files to /open_webui dir 2024-09-04 22:54:48 +08:00			`from open_webui.env import SRC_LOG_LEVELS`
feat: add DuckDuckGo search functionality using duckduckgo_search library 2024-06-11 22:19:08 +08:00
			`log = logging.getLogger(__name__)`
			`log.setLevel(SRC_LOG_LEVELS["RAG"])`


chore: format 2024-06-18 05:32:23 +08:00			`def search_duckduckgo(`
refac/fix: rename WEB_SEARCH_CONCURRENT_REQUESTS to WEB_LOADER_CONCURRENT_REQUESTS 2025-08-19 00:06:36 +08:00			`query: str,`
			`count: int,`
			`filter_list: Optional[list[str]] = None,`
			`concurrent_requests: Optional[int] = None,`
chore: format 2024-06-18 05:32:23 +08:00			`) -> list[SearchResult]:`
feat: add DuckDuckGo search functionality using duckduckgo_search library 2024-06-11 22:19:08 +08:00			`"""`
			`Search using DuckDuckGo's Search API and return the results as a list of SearchResult objects.`
			`Args:`
			`query (str): The query to search for`
			`count (int): The number of results to return`

			`Returns:`
remove List imports 2024-08-14 20:46:31 +08:00			`list[SearchResult]: A list of search results`
feat: add DuckDuckGo search functionality using duckduckgo_search library 2024-06-11 22:19:08 +08:00			`"""`
			`# Use the DDGS context manager to create a DDGS object`
improve stack trace of duckduckgo exception * fix search_results out of scope * ddgs.text does already always return a list 2025-04-08 19:51:54 +08:00			`search_results = []`
feat: add DuckDuckGo search functionality using duckduckgo_search library 2024-06-11 22:19:08 +08:00			`with DDGS() as ddgs:`
refac/fix: rename WEB_SEARCH_CONCURRENT_REQUESTS to WEB_LOADER_CONCURRENT_REQUESTS 2025-08-19 00:06:36 +08:00			`if concurrent_requests:`
			`ddgs.threads = concurrent_requests`

feat: add DuckDuckGo search functionality using duckduckgo_search library 2024-06-11 22:19:08 +08:00			`# Use the ddgs.text() method to perform the search`
improve stack trace of duckduckgo exception * fix search_results out of scope * ddgs.text does already always return a list 2025-04-08 19:51:54 +08:00			`try:`
			`search_results = ddgs.text(`
duckduckgo: backend api has been deprecated since december also increase duckduckgo-search version see https://github.com/deedy5/duckduckgo_search/commit/3ee8e08b1c8efc9b7356f406db299f1114dc4860 2025-04-08 20:01:44 +08:00			`query, safesearch="moderate", max_results=count, backend="lite"`
improve stack trace of duckduckgo exception * fix search_results out of scope * ddgs.text does already always return a list 2025-04-08 19:51:54 +08:00			`)`
			`except RatelimitException as e:`
			`log.error(f"RatelimitException: {e}")`
Set filter_list as optional param in duckduckgo.py 2024-06-17 15:34:59 +08:00			`if filter_list:`
refac: duckduckgo 2025-02-16 08:45:56 +08:00			`search_results = get_filtered_results(search_results, filter_list)`

feat: add DuckDuckGo search functionality using duckduckgo_search library 2024-06-11 22:19:08 +08:00			`# Return the list of search results`
refac: duckduckgo 2025-02-16 08:45:56 +08:00			`return [`
			`SearchResult(`
			`link=result["href"],`
			`title=result.get("title"),`
			`snippet=result.get("body"),`
			`)`
			`for result in search_results`
			`]`