Search Engine Katalog für Esoterik, Naturheilkunde, Medizin & Psychologie

FDSE deutsche Hilfe | englische Hilfe



[ Hilfe: Inhaltsverzeichnis ]
   
Wie Sie Abschnitte Ihrer Seiten daran hindern indiziert zu werden  
     
 

Dieses Hilfethema beschreibt wie Sie verhindern das bestimmte Absätze eines Dokuments indiziert zu werden. Um zu verhindern das ein ganzes Dokument indiziert wird sehen Sie, Wie können Sie Seiten daran hindern indiziert zu werden.

FDSE unterstützt das Eigentums- "Roboter" Kommentarschild. Dieses Schild erlaubt einen Netzautor diese Norm anzuwenden und den ausschluß beliebiger Absätzen eines Dokuments.

Das Schild hat Attribute mit den folgenden möglichen Werten:

  • noindex - auf den in das Schild eingeschlossenen Text wird nicht im Index gesichert
  • nofollow - Verbindungen werden nicht vom Text in der Anlage herausgezogen
  • keine - beigefügter Text wird nicht indiziert noch durchsuchte nach Verbindungen

Werte "indizieren" "folgen", und "alle" sind auch gültig. In Übung sind sie ignoriert, da sie der unausgesprochene Verzug sind.

Es wird erwartet, daß dieses Merkmal zum Kundenbedarf paßt, bestimmte Teile eines Dokuments wie einen nautischen Randblock daran zu hindern, in die Suche einbezogen zu werden.

Beispiel:

<HTML>
<BODY>

    This text will be indexed.
    <A HREF="foo.html"> this link will be followed </A>

    <!-- robots content="none" -->

        This text will NOT be indexed.
        <A HREF="bar.html"> this link will NOT be followed </A>

    <!-- /robots -->

    <!-- robots content="noindex" -->

        This text will NOT be indexed.
        <A HREF="bar1.html"> this link WILL be followed </A>

    <!-- /robots -->

    <!-- robots content="nofollow" -->

        This text WILL be indexed.
        <A HREF="bar1.html"> this link will NOT be followed </A>

    <!-- /robots -->

    la la la

</BODY>
</HTML>

Diese Syntax wurde geplant zu den Robotern zu passen, Metaschild.

Für Dokumente die beide die "Roboter" haben, kommentieren Metaschild und die "Roboter" kennzeichnen, die einschränkendste Interpretation wird gemacht, immer auf der Seite ein nicht irrend, indizieren oder nicht folgen.

Wegen dieses Schilds wird immer von FDSE respektiert, sogar wann "Crawler: Gauner "sind gesetzt zu 1 und allen anderen Robotern Ausschlußregeln sind ignoriert. Von diesem ist, weil die Roboter kommentieren, daß Schild Eigentumsist, und wird auf diese Art erwartet, daß er nur vom FDSE Verwalter verwendet wird.

Verschlüsselung:

Alle Suchmaschinen sind ermutigt, diese Syntax zu unterstützen, da es zu kleinen IndexDateien , schnelleren Suchen und mehr genauen Ergebnissen führt.

In Perl zieht der folgende regelmäßige Ausdruck die Roboter heraus Abschnitte kennzeichneten "keine". Dieses regex ist geplant, zu whitespace, Zeilenpausen, Fall unempfindlich zu sein, und d zitierte vs-aufdecken Natur des Attributwerts. Dieses regex sollte ausgeführt werden, sobald die Datei gelesen ist:

$_ = $text;
s'<!--\s*robots\s+content\s*=\s*"?none"?\s*-->.*?<!--\s*/robots\s*-->' 'isg;

Für Unterroutinen, die Verbindungen herausziehen, zieht dieser Code die "nofollow" Abschnitte heraus:

s'<!--\s*robots\s+content\s*=\s*"?nofollow"?\s*-->.*?<!--\s*/robots\s*-->' 'isg;

Eine letzte Ersetzung gegen den "noindex" Teil der Datei ist vor Indexieren oder Suchen nach Schlüsselwörtern erforderlich. Für jene Suchmaschinen, die gerade in Text lesen und es indizieren, ohne Verbindungen herauszuziehen, funktioniert das mehr effecient einzelne regex:

s'<!--\s*robots\s+content\s*=\s*"?(none|noindex)"?\s*-->.*?<!--\s*/robots\s*-->' 'isg;

Geschichte: ursprünglich eingeführt als das FDSE: Roboter HTML Schild in version r2.0.0.0031.

Wie von Version R2.0.0.0044, wurde das HTML Kommentaräquivalent eingeführt. Dieses äquivalente Format ist bevorzugt, weil es keine Probleme mit Herausgebern verursacht, die nur strikt gültige HTML unterstützen und es keine Probleme damit verursacht zu nisten, und es als ein verkäuferunabhängiger Standard übernommen werden kann. Die äquivalenten Formen sind:

<FDSE:ROBOTS VALUE="none"> xxx </FDSE:ROBOTS>
<!-- robots content="none" --> xxx <!-- /robots -->

<FDSE:ROBOTS VALUE="nofollow"> xxx </FDSE:ROBOTS>
<!-- robots content="nofollow" --> xxx <!-- /robots -->

<FDSE:ROBOTS VALUE="noindex"> xxx </FDSE:ROBOTS>
<!-- robots content="noindex" --> xxx <!-- /robots -->

Handhabung dieser Schilder ist Fall unempfindlich und sind zu linear und senkrecht whitespace unempfindlich.

nervt/zurückdrehen Verträglichkeit : in frühen Versionen verwendete FDSE das einzigartige Format "FDSE: Roboter "und" ! - Roboterinhalt ". Es später realisiert wurde, daß für Verträglichkeit mit den "Robotern" Metaschild und das "robots.txt" feilen, würde das mehrfache Format gebraucht sein müssen. Auf diese Art, wie von Version R2.0.0.0048, unterstützt die FDSE Software sowohl einzigartige als auch mehrfache Formen, und die Dokumentation fördert die mehrfache Form. Wenn Sie eine frühere Version der FDSE Software haben, dann sollten Sie den einzigartigen Form- "Roboter" statt die einzigartigen "Roboter" dabei verwenden, Ihre Schilder zu schaffen. Entschuldigung.

 
 
Übersetzung Esoterik-web.net der Katalog für Esoterik, Naturheilkund, Medizin & Psychologie
spirit2you.de spirittoyou.de spirit2you.at spirittoyou.ch Lebensberatung24.de Bannernetz2000.de FDSE.eu Suchmaschine, Katalog, Fluid Dynamic Search Engine thue.de Reiki Meister Lehrer natur-fee.de - Mueritz Seminare Seminar - Feriendorf eso4you.de Domainreseller Domain Registration Robot ab 12 Domain