Gleiche aufeinander folgende Zeichen reduzieren

Im Laufe der Zeit und Arbeit an diesem Blog, bin ich immer wieder auf diverse Herausforderungen gestoßen. Eine von diesen wäre die Formatierung der Links zu den einzelnen Artikeln. Natürlich könnte ich einfach ein ?eintrag=id_des_eintrags an die URL des Blogs dranhängen, aber das sieht sehr unschön aus. Also habe ich mich entschieden die Links auch aus zuschreiben.

Dafür nehme ich ganz einfach den Titel eines Artikels her, und bearbeite ihn etwas. Sonderzeichen werden durch ‚-‚ ersetzt, Satz- sowie Leerzeichen ebenfalls. Einzig Umlaute bleiben erhalten, werden aber mit urlencode(); maskiert, was für den Link selbst kein größeres Problem darstellt.

Aber was hat das alles mit „gleichen, aufeinander folgenden Zeichen“ zu tun?
Weiterlesen

Homepage / Website mit oder ohne „www.“

Diese Frage mag sich banal anhören, aber das ist sie bei weitem nicht, denn das „www.“ ist ja eigentlich nichts weiter als eine Subdomain, welche auf den / des Servers gelenkt wird. Somit ist die betreffende Seite sowohl unter http://www.domain.tld als auch unter http://domain.tld erreichbar. Und genau das kann nun bei Suchmaschinen – wie zum Beispiel Google – ungewollte Folgen haben. Stichwort „Duplicate Content„, welchen man ja tunlichst vermeiden sollte.
Weiterlesen

Verzeichnis auf Subdomain umleiten

Bei der Konzeption von Webseiten steht man vor mehreren Problemen.

Wenn man nun „Unterseiten“ einbinden möchte, stellt sich zunächst die Frage, ob man dies über Verzeichnisse (http://www.domain.tld/unterseite/) oder über Subdomains (http://unterseite.domain.tld/) lösen möchte.

Die einfachere Variante wäre sicherlich die mit den Verzeichnissen. Auch streiten sich die Gelehrten, was bei Google nun besser ist, Verzeichnis oder Subdomain.

Weiterlesen

Umlaute aus einem String entfernen

Auch eine häufig gestellte Frage ist es, wie man Umlaute aus einem String entfernt – maskiert, weil man diesen String als Link verwenden möchte, oder Ähnliches.

Nun, für die Linkvariante empfiehlt sich urlencode($string);. Diese PHP-eigene Funktion maskiert alle Umlaute in einem Link. Dadurch sind diese allerdings nicht mehr leserlich.
Weiterlesen

(Gentoo)-Linux und die nett gemeinten Hinweise

Mal wieder nach einem Worldupdate, in dem – wie so häufig bei Gentoo – diverse Libs durcheinander gewürfelt wurden, vermeldete dies auch mein System in dem es mich darauf aufmerksam machte, das ich doch bitte emerge @preserved-rebuild durchführen solle.

An und für sich nichts wirklich Spannendes, passiert öfter mal. Aber diesmal war auch OpenOffice betroffen.
Weiterlesen

Uhrzeit eines Gentoo-Systemes automatisch aktualisieren

Aus aktuellem Anlass – Zeitumstellung von Winterzeit auf Sommerzeit – habe ich mich mal dem Thema gewidmet, wie man die Uhrzeit auf seinem Gentoo-System automatisch aktualisieren lassen kann.

Dies funktioniert mit Hilfe des NTP (Network Time Protcoll).

Dieses Protokoll sorgt dafür, das die Uhrzeit immer aktuell ist, in dem sie von einem Zeitserver aus dem Netz geholt wird.
Weiterlesen

Dateigröße anzeigen lassen

Wenn man einige Dateien zum Download anbietet, und dies nicht gerade über eine Datenbank steuert, in der die Größe der Datei gespeichert ist, kann man diese auch über eine kleine Funktion herausfinden. Sinnvoll ist es allemal bei Downloads die Größe der Datei anzugeben, wenn diese einige Kilobyte übersteigt.
Weiterlesen

String nach einer bestimmten Anzahl Zeichen abschneiden

… aber nicht mitten im Wort.

Wer Seiten betreibt, bei denen Vorschauen auf Texte angezeigt werden, sieht sich vor dem Problem, diese Vorschau auf eine gewisse Anzahl Zeichen zu begrenzen. Natürlich könnte man hergehen und ganz „stumpf“ einfach nach xxx Zeichen den String abschneiden, sieht nur nicht unbedingt schön aus, wenn das dann mitten im Wort ist.

Hier nun die Lösung:
Weiterlesen

UTF-8 unter Gentoo Linux einrichten

Was ist Unicode?

Unicode durchbricht die traditionelle Single-Byte-Grenze der Zeichensätze. Der Zeichensatz nutzt 17 Ebenen von 65.536 Code Points und ermöglicht ein Maximum von 1.114.112 Zeichen. Die erste Ebene wird „Basic Multilingual Plane“ oder BMP bezeichnet und beinhaltet fast alles was Sie je brauchen werden. Viele nahmen fälschlicherweise an, dass Unicode ein 16-Bit-Zeichensatz sei.

Unicode wurde auf verschiedene Weise abgebildet, aber die meist verbreitetsten sind UTF (Unicode Transformation Format) und UCS (Universal Character Set). Eine Nummer hinter UTF gibt die Zahl der Bits in einer Einheit an, während die Nummer hinter UCS die Zahl der Bytes angibt. Aufgrund der sauberen 8-Bit-Basis von UTF-8, ist es die weitverbreitetste Konvention zum Austausch von Unicode-Text geworden und ist daher Thema dieses Dokuments.
Weiterlesen