regarder extrait video film streaming

Streamavenue est un moteur de recherche dédié au streaming, films, séries TV, mangas, VOD

Afin de réduire le temps de réponse il fonctionne en cluster, c'est à dire sur plusieurs machines différentes.

Il est composé d'un frontal web, d'un moteur de recherche et de robots d'indexations

Architecture

Frontal web : PHP/JS

Une ou plusieurs machines qui fournissent l'interface du site et mettent en cache les recherches déjà effectuées

Moteur de recherche : C/Mysql

Une ou plusieurs machines qui interrogent les bases de données de sites indexés

Les pages indexées apparaissent 24h après avoir été indexées

Crawlers

Robots d'indexation : C/Shell

User-Agent : BZCBot 0.1

Ils respectent la norme robots.txt

Ils parcourent les sites pour en indexer ils les parcourent en moyenne tous les 2 jours

Fonctionnement

A partir d'une liste de site web que je vérifie, les crawlers vont faire un indexation full text

Par la suite, certaines urls sont supprimées à la main

Par défaut les pages de forum et de fiche membres, en autre, ne sont pas indexées.

Globalement, j'essaie de filtrer les URLs sans contenu quand c'est possible

Caractéristiques

Recherche booléenne

Il est possible d'utiliser des opérateurs booléens

ET logique : (& ou AND)

streaming & film

Toutes les pages contenant le mot streaming et le mot film

OU logique (| ou OR)

streaming | film

Toutes les pages contenant le mot streaming ou le mot film

NON logique (~ ou NOT)

streaming ~film

Toutes les pages contenant le mot streaming mais pas le mot film

Recherche exacte

"streaming film"

Toutes les pages contenant la phrase streaming film

A venir :